1. 針對每一個經 DCT 轉換後所得到的 8*8 係數矩陣, 都要使用一個同樣是 8*8 大小的量化矩陣做量化壓縮程序。為什麼量化矩陣中, 不同位置的值大小不同, 代表的涵義為何?
因為各式和前面的差距,即變動的幅度
2. 量化後的係數矩陣中, 存在許多個 0, 代表的涵義為何?
彼此間的差異不大,沒什麼變化
3. 用 Zigzag 的方式, 將二維矩陣轉換為一維矩陣的目的為何? 優點為何?
目的在於可以方便壓縮,優點是:對於後面連續的0可以省略
4. 為什麼 JPEG 壓縮的最後一個步驟必須使用無失真的壓縮技術?
還不甚清楚....
5. 熵編碼(entropy coding)的熵所代表的意義為何?
以下是搜尋到的相關文章,提出跟同學分享
http://episte.math.ntu.edu.tw/articles/mm/mm_13_3_01/index.html
2007年6月20日 星期三
Week 15: JEPG compression (1)
討論的內容包含:
1. 什麼是色彩空間? 為什麼有不同的色彩空間? 轉換的目的為何?
我覺得應該是對於一種色彩的表示方式和計算方法可以視為一個空間,像是線性代數常用的歐式空間等,
色彩的表示方式很多,所以有不同的表示方式,用來加強某些部分的表現程度,所以有不同的色彩空間,
轉換的目的再於讓以某種的表示方式改成另一種,方便日後計算跟表示
2. 什麼是量化? 好處是什麼?
字面上意義應該是說"數量化",很多科學的東西都會提到"量化",像是分等級,用來比較之類的,若是沒有數量化,則很多事情就會變的比較不精確,像是比身高體重等!量化的好處就在於可以讓要描述的東西容易比較,且容易表達
3. 什麼是轉換? 為什麼要做 DCT 轉換?
從一個性質變成另一個性質,為何要做DCT轉換,DCT轉換比較符合自然現象的表現
4. DCT 轉換後的矩陣的意義為何? 何謂低頻? 何謂高頻? 對應到一張影像所呈現的意義是什麼?
低頻:單位時間震動次數較少的波形
高頻:單位時間震動次數較多的波形
代表亮度的頻率
1. 什麼是色彩空間? 為什麼有不同的色彩空間? 轉換的目的為何?
我覺得應該是對於一種色彩的表示方式和計算方法可以視為一個空間,像是線性代數常用的歐式空間等,
色彩的表示方式很多,所以有不同的表示方式,用來加強某些部分的表現程度,所以有不同的色彩空間,
轉換的目的再於讓以某種的表示方式改成另一種,方便日後計算跟表示
2. 什麼是量化? 好處是什麼?
字面上意義應該是說"數量化",很多科學的東西都會提到"量化",像是分等級,用來比較之類的,若是沒有數量化,則很多事情就會變的比較不精確,像是比身高體重等!量化的好處就在於可以讓要描述的東西容易比較,且容易表達
3. 什麼是轉換? 為什麼要做 DCT 轉換?
從一個性質變成另一個性質,為何要做DCT轉換,DCT轉換比較符合自然現象的表現
4. DCT 轉換後的矩陣的意義為何? 何謂低頻? 何謂高頻? 對應到一張影像所呈現的意義是什麼?
低頻:單位時間震動次數較少的波形
高頻:單位時間震動次數較多的波形
代表亮度的頻率
2007年6月14日 星期四
WEEK15 JPEG問題
上禮拜有點累倒所以沒去上課
這次就看了一下上週的進度然後來寫寫這些問題
當然...主要是查來的資料看一看整理一下
1. 什麼是色彩空間? 為什麼有不同的色彩空間? 轉換的目的為何?
ANS:(1)使用一組值來代表顏色的數學模型
(2)因為有不同的方法來代表色彩空間
例如RGB(三原色)三色形成的色彩空間、HSB(色調、飽和度、亮度)形成的色彩空間等,所以會有不同的表示
(3)例如RGB色彩空間是基於光學設備採用的方式
但假如我們想把圖像印出來時,需要使用CMYK色彩空間
這時候,我們就需要色彩空間的轉換
2. 什麼是量化? 好處是什麼?
ANS: (1)將類似的數值取出來減少重覆的數據量
(2)好處可以減少圖像的數據量,選擇性的丟棄部分數據作為壓縮
3. 什麼是轉換? 為什麼要做 DCT 轉換?
ANS: (1)應該和色彩空間的轉換那種概念差不多...
我也不太會描述
(2)就是要讓矩陣的"能量集中"
可以造成比較沒有失真的感覺
4. DCT 轉換後的矩陣的意義為何? 何謂低頻? 何謂高頻? 對應到一張影像所呈現的意義是什麼?
ANS: (1)轉換後會讓能量集中在左上角,有更大的壓縮空間
(2)(3)雖然常常看到JPEG的技術有低頻和高頻這詞...
不過都沒啥說明
大致上就是壓縮的時候,圖像經濾波分成若干個低頻和高頻的分量
大致是二維的
(4)這個真的不太清楚...也許要再找找資料
這次就看了一下上週的進度然後來寫寫這些問題
當然...主要是查來的資料看一看整理一下
1. 什麼是色彩空間? 為什麼有不同的色彩空間? 轉換的目的為何?
ANS:(1)使用一組值來代表顏色的數學模型
(2)因為有不同的方法來代表色彩空間
例如RGB(三原色)三色形成的色彩空間、HSB(色調、飽和度、亮度)形成的色彩空間等,所以會有不同的表示
(3)例如RGB色彩空間是基於光學設備採用的方式
但假如我們想把圖像印出來時,需要使用CMYK色彩空間
這時候,我們就需要色彩空間的轉換
2. 什麼是量化? 好處是什麼?
ANS: (1)將類似的數值取出來減少重覆的數據量
(2)好處可以減少圖像的數據量,選擇性的丟棄部分數據作為壓縮
3. 什麼是轉換? 為什麼要做 DCT 轉換?
ANS: (1)應該和色彩空間的轉換那種概念差不多...
我也不太會描述
(2)就是要讓矩陣的"能量集中"
可以造成比較沒有失真的感覺
4. DCT 轉換後的矩陣的意義為何? 何謂低頻? 何謂高頻? 對應到一張影像所呈現的意義是什麼?
ANS: (1)轉換後會讓能量集中在左上角,有更大的壓縮空間
(2)(3)雖然常常看到JPEG的技術有低頻和高頻這詞...
不過都沒啥說明
大致上就是壓縮的時候,圖像經濾波分成若干個低頻和高頻的分量
大致是二維的
(4)這個真的不太清楚...也許要再找找資料
week15 -- (JPEG)
嗯...寫的不多...若寫的有問題...請不吝指教...
1. 什麼是色彩空間? 為什麼有不同的色彩空間? 轉換的目的為何?
由R,G,B或WIKI中提到的YUV都是色彩空間的一種,他們都可以形容色彩,只是組成的基本東西不同,描述顏色的方式不同罷了!
因為每種色彩空間所能夠描述的顏色及方法都不同,每種色彩空間的區域並不會完全一致。
要看需求來選擇轉換色彩空間。
2. 什麼是量化? 好處是什麼?
將複雜的東西轉化為數字,讓我們比較容易了解,並進而使用它。
好處是會使複雜的東西簡單化,變的較好處理。
3. 什麼是轉換? 為什麼要做 DCT 轉換?
嗯...不太會說...
為了要轉換到頻率空間,這樣才可以看的比較清楚,較清楚空間的內容。
4. DCT 轉換後的矩陣的意義為何? 何謂低頻? 何謂高頻? 對應到一張影像所呈現的意義是什麼?
意義...嗯...
頻率:等於週期的倒數,若你做完一個週期的時間長,那麼你的頻率就相對的短(低),若你花很少時間做完一個週期,那麼頻率就高。
對應後...低頻是相鄰的像素變化率不大,高頻是相鄰的像素變化率大的意思。大約都低頻...畫面是漸漸的、緩慢的變化。
1. 什麼是色彩空間? 為什麼有不同的色彩空間? 轉換的目的為何?
由R,G,B或WIKI中提到的YUV都是色彩空間的一種,他們都可以形容色彩,只是組成的基本東西不同,描述顏色的方式不同罷了!
因為每種色彩空間所能夠描述的顏色及方法都不同,每種色彩空間的區域並不會完全一致。
要看需求來選擇轉換色彩空間。
2. 什麼是量化? 好處是什麼?
將複雜的東西轉化為數字,讓我們比較容易了解,並進而使用它。
好處是會使複雜的東西簡單化,變的較好處理。
3. 什麼是轉換? 為什麼要做 DCT 轉換?
嗯...不太會說...
為了要轉換到頻率空間,這樣才可以看的比較清楚,較清楚空間的內容。
4. DCT 轉換後的矩陣的意義為何? 何謂低頻? 何謂高頻? 對應到一張影像所呈現的意義是什麼?
意義...嗯...
頻率:等於週期的倒數,若你做完一個週期的時間長,那麼你的頻率就相對的短(低),若你花很少時間做完一個週期,那麼頻率就高。
對應後...低頻是相鄰的像素變化率不大,高頻是相鄰的像素變化率大的意思。大約都低頻...畫面是漸漸的、緩慢的變化。
2007年6月13日 星期三
Week15上課筆記
編碼
色彩轉換空間
將影像由RGB轉成YUV(Y:一個像素的亮度,U和V:調色與飽和度)的不同色彩空間,一般的色彩空間由RGB所組成,我們將他轉換成另一種色彩空間YUV,因為人類的眼睛對於亮度看的比調色和飽和度看的更仔細,所以運用YUV的色彩空間讓影像壓縮更有效率
縮減取樣
減少U和V的取樣
離散餘弦變換(DCT)
座標轉換:根據資料特性發展出一套新的座標系統,以減少資料儲存的數量或者是資料比較好被描述
轉換後的座標,左上角就是DC係數(整個亮度的平均值)
量化
將想要表現的東西以數字表現出來
人類對於高頻率的東西,分辨的能力不是很好,所以我們可以運用高頻率降低資訊的數量
轉換後的DCT係數矩陣跟一個量化矩陣作運算,運算後的矩陣會出現蠻明顯的差異

低頻:相鄰兩像素的變化率不大
高頻:相鄰兩像素的變化率大
色彩轉換空間
將影像由RGB轉成YUV(Y:一個像素的亮度,U和V:調色與飽和度)的不同色彩空間,一般的色彩空間由RGB所組成,我們將他轉換成另一種色彩空間YUV,因為人類的眼睛對於亮度看的比調色和飽和度看的更仔細,所以運用YUV的色彩空間讓影像壓縮更有效率
縮減取樣
減少U和V的取樣
離散餘弦變換(DCT)
座標轉換:根據資料特性發展出一套新的座標系統,以減少資料儲存的數量或者是資料比較好被描述
轉換後的座標,左上角就是DC係數(整個亮度的平均值)
量化
將想要表現的東西以數字表現出來
人類對於高頻率的東西,分辨的能力不是很好,所以我們可以運用高頻率降低資訊的數量
轉換後的DCT係數矩陣跟一個量化矩陣作運算,運算後的矩陣會出現蠻明顯的差異

低頻:相鄰兩像素的變化率不大
高頻:相鄰兩像素的變化率大
2007年6月11日 星期一
Week15 JPEG
把老師所提的問題
在經過整理過後
以自己的口吻回答
我覺得我答的不是很好
請大家多多指教
找出我的問題
1. 什麼是色彩空間? 為什麼有不同的色彩空間? 轉換的目的為何?
Ans1:
一群顏色的集合即可稱為色彩空間
Ans2:
不同的色彩空間代表用不同的條件
來形容一群色彩的集合
例如RGB是用紅藍綠三色各佔多少來形容一種顏色
而YCbCr卻是用亮度、色差與飽和度來表達一種顏色
由此可知雖然描述的條件不同卻可同樣用來形容一群顏色
Ans3:
看使用者的需求
像是印表機使用的色彩空間是YMCK
即是一個很好的例子
試想用RGB要怎麼表達出來黑色呢?
2. 什麼是量化? 好處是什麼?
Ans1:
量化即是把一種現象或想描述的事情用數量的形式來表現
Ans2:
可使數據的結果更簡潔
方便觀察或者簡化
3. 什麼是轉換? 為什麼要做 DCT 轉換?
Ans1:
其實轉換的概念我覺得跟色彩空間的轉換概念很像
也是以不同的方式來描述的一群東西的集合
例如要表達平面上的一條線常使用的方法為
y=ax+b
但這個表達是有缺陷的
因為無法表達垂直的角度
因此有人提出了不同的方法
來形容一條線
r = x.cosθ + y.sinθ
這就是一種轉換
而其實這兩個方程式
都是在描述一條線!
Ans2:
因為離散餘弦變換具有很強的"能量集中"特性大多數的自然信號
(包括聲音和圖像)的能量都集中在離散餘弦變換後的低頻部分
所以從講義的8*8陣列可以發現
大部分的頻率都集中到右上角去了
4. DCT 轉換後的矩陣的意義為何? 何謂低頻? 何謂高頻? 對應到一張影像所呈現的意義是什麼?
Ans1:
會有低頻集中在左上角
高頻散佈在右下角的特性
Ans2:
Ans3:
Ans4:
在經過整理過後
以自己的口吻回答
我覺得我答的不是很好
請大家多多指教
找出我的問題
1. 什麼是色彩空間? 為什麼有不同的色彩空間? 轉換的目的為何?
Ans1:
一群顏色的集合即可稱為色彩空間
Ans2:
不同的色彩空間代表用不同的條件
來形容一群色彩的集合
例如RGB是用紅藍綠三色各佔多少來形容一種顏色
而YCbCr卻是用亮度、色差與飽和度來表達一種顏色
由此可知雖然描述的條件不同卻可同樣用來形容一群顏色
Ans3:
看使用者的需求
像是印表機使用的色彩空間是YMCK
即是一個很好的例子
試想用RGB要怎麼表達出來黑色呢?
2. 什麼是量化? 好處是什麼?
Ans1:
量化即是把一種現象或想描述的事情用數量的形式來表現
Ans2:
可使數據的結果更簡潔
方便觀察或者簡化
3. 什麼是轉換? 為什麼要做 DCT 轉換?
Ans1:
其實轉換的概念我覺得跟色彩空間的轉換概念很像
也是以不同的方式來描述的一群東西的集合
例如要表達平面上的一條線常使用的方法為
y=ax+b
但這個表達是有缺陷的
因為無法表達垂直的角度
因此有人提出了不同的方法
來形容一條線
r = x.cosθ + y.sinθ
這就是一種轉換
而其實這兩個方程式
都是在描述一條線!
Ans2:
因為離散餘弦變換具有很強的"能量集中"特性大多數的自然信號
(包括聲音和圖像)的能量都集中在離散餘弦變換後的低頻部分
所以從講義的8*8陣列可以發現
大部分的頻率都集中到右上角去了
4. DCT 轉換後的矩陣的意義為何? 何謂低頻? 何謂高頻? 對應到一張影像所呈現的意義是什麼?
Ans1:
會有低頻集中在左上角
高頻散佈在右下角的特性
Ans2:
Ans3:
Ans4:
2007年6月9日 星期六
Weak 15 - jpeg
關於jpeg的隱藏技術
由於目前我在做的專研是關於視覺密碼的部份
所以先前也讀了些關於jpeg隱藏浮水印的方法
首先相對於之前的bmp檔案
jpeg檔案是壓縮後的圖像
所以最低位元是壓縮時首先被捨棄掉的部份
(因為最低位元的影像雜亂,捨棄後對原圖沒太大影響)
由於最低位元被捨棄掉了
所以先前所使用的LSB則不適用
再來我要提到空間域及頻率域的技術
空間域:
空間域就是指我們平常圖像用bitmap紀錄的方式
而先前提到的LSB就屬於空間域的技術
但是在jpeg中我們並無法使用LSB來隱藏資訊
因此既然我們無法將資訊隱藏在最低位元中
我們則求其次將資訊隱藏在中頻帶
(由於壓縮影像的資訊隱藏,我們都是先轉至頻率域找出適合隱藏的地方,
然後再轉回空間域,但是在此利用影像四元樹的方法則無須經過此轉換即
可找出中低頻位址,至於頻帶所代表的涵義,我會在頻率域的部份做解釋)
如此一來便能在影響原圖的最低限度下藏入資訊
頻率域:
最簡單的想法,我們將它想成音頻
大概就是長的像那樣的東西
至於我們要如何將空間域的圖片轉換成頻率域
主要是使用以下三種轉換方式:
1.離散餘弦轉換
2.離散小波轉換
3.快速傅立葉轉換
(其轉換公式在此就不詳述,否則真會打不完)
藉由以上方法我們就能將空間域的圖片轉換成頻率域
在頻率域中,我們分成高頻帶、中頻帶、低頻帶三個部份
低頻帶就像是空間域中的最高位元
高頻帶則代表最低位元
由於之前提到最低位元是jpeg影像最優先捨去的部份
所以資訊不能藏在高頻帶
而低頻帶影響圖片最大,所以也不能藏在低頻帶
因此我們所能藏匿的地方就只剩中頻帶了
以上大致就是jpeg這類壓縮圖象隱藏資訊時所用的技術
至於更細節的部分在此也不多詳述
參考論文:
沈伯承-民國92年,中央大學碩士論文,基於灰階視覺密碼之浮水印技術
由於目前我在做的專研是關於視覺密碼的部份
所以先前也讀了些關於jpeg隱藏浮水印的方法
首先相對於之前的bmp檔案
jpeg檔案是壓縮後的圖像
所以最低位元是壓縮時首先被捨棄掉的部份
(因為最低位元的影像雜亂,捨棄後對原圖沒太大影響)
由於最低位元被捨棄掉了
所以先前所使用的LSB則不適用
再來我要提到空間域及頻率域的技術
空間域:
空間域就是指我們平常圖像用bitmap紀錄的方式
而先前提到的LSB就屬於空間域的技術
但是在jpeg中我們並無法使用LSB來隱藏資訊
因此既然我們無法將資訊隱藏在最低位元中
我們則求其次將資訊隱藏在中頻帶
(由於壓縮影像的資訊隱藏,我們都是先轉至頻率域找出適合隱藏的地方,
然後再轉回空間域,但是在此利用影像四元樹的方法則無須經過此轉換即
可找出中低頻位址,至於頻帶所代表的涵義,我會在頻率域的部份做解釋)
如此一來便能在影響原圖的最低限度下藏入資訊
頻率域:
最簡單的想法,我們將它想成音頻
大概就是長的像那樣的東西
至於我們要如何將空間域的圖片轉換成頻率域
主要是使用以下三種轉換方式:
1.離散餘弦轉換
2.離散小波轉換
3.快速傅立葉轉換
(其轉換公式在此就不詳述,否則真會打不完)
藉由以上方法我們就能將空間域的圖片轉換成頻率域
在頻率域中,我們分成高頻帶、中頻帶、低頻帶三個部份
低頻帶就像是空間域中的最高位元
高頻帶則代表最低位元
由於之前提到最低位元是jpeg影像最優先捨去的部份
所以資訊不能藏在高頻帶
而低頻帶影響圖片最大,所以也不能藏在低頻帶
因此我們所能藏匿的地方就只剩中頻帶了
以上大致就是jpeg這類壓縮圖象隱藏資訊時所用的技術
至於更細節的部分在此也不多詳述
參考論文:
沈伯承-民國92年,中央大學碩士論文,基於灰階視覺密碼之浮水印技術
2007年6月7日 星期四
Week 14 : 上課問題
首先看到這份資料,是網路上的資料,
之前就有看過維紀百科的東西,
中文的發現一大堆東西看不懂,後來比較偏愛英文
關於這份文件,剛看可能不太了解他再說什麼,
有很多的專有名詞,看不懂的比看的懂得多
文章第一段,我提出質疑
文:"PNG 可以被用來無失真地儲存照片,
但是檔案太大,不適合在網頁上放照片"
我記得 PNG,是 Portable Network Graphics
從字面上來推敲,應該是用於網路上的檔案格式
怎麼會說檔案太大,不適合放在網頁上?
之前有看稍微看一下 DCT 的東西,但是還是不了解為何要這樣做。
還有什麼是量化矩陣? 何謂頻率空間?
之前就有看過維紀百科的東西,
中文的發現一大堆東西看不懂,後來比較偏愛英文
關於這份文件,剛看可能不太了解他再說什麼,
有很多的專有名詞,看不懂的比看的懂得多
文章第一段,我提出質疑
文:"PNG 可以被用來無失真地儲存照片,
但是檔案太大,不適合在網頁上放照片"
我記得 PNG,是 Portable Network Graphics
從字面上來推敲,應該是用於網路上的檔案格式
怎麼會說檔案太大,不適合放在網頁上?
之前有看稍微看一下 DCT 的東西,但是還是不了解為何要這樣做。
還有什麼是量化矩陣? 何謂頻率空間?
JPEG檔案預讀...
看了之後...疑問有點多,
他所謂的YUV是類似RGB的意思嗎?
最不懂的地方是...DC係數?
以及Discrete cosine transform那裡,
到底為什麼矩陣最左上角的(絕對)值會最大呢?
是怎麼算的?
為什麼Image中的每個成份(y,u,v),
是用8 * 8的pixels區域?
色彩空間跟頻率空間?有啥關聯嗎?
他所謂的YUV是類似RGB的意思嗎?
最不懂的地方是...DC係數?
以及Discrete cosine transform那裡,
到底為什麼矩陣最左上角的(絕對)值會最大呢?
是怎麼算的?
為什麼Image中的每個成份(y,u,v),
是用8 * 8的pixels區域?
色彩空間跟頻率空間?有啥關聯嗎?
2007年6月6日 星期三
Week 14: JPEG
雖然平常在網路上還滿常見到JPEG,
但我對他的印象始終停留在
1.一種影像格式(picture1.jpg)
2.使用失真壓縮(檔案比.bmp檔小很多,但是圖片會變醜)
3.相機的圖片直接使用jpg檔案
除此之外就不知道關於它的更多東西,剛好藉此來對他做個剖析
由於英文閱讀能力不佳
所以我選擇了維基百科繁體中文版做個閱讀
維基百科上說JPEG是採用把影像從RGB轉換成Y(像素亮度)U(色調)V(飽和度)
並說"比起色調與飽和度,人類的眼睛對於像素的亮度更加敏感"
並且把編碼器(encoder)建立在這個理論的基礎上
據說有用到量化...不過看到一堆數字就先眼花了@_@
看到那區時,稍微看了一下那堆數字與壓縮的相關性
似乎跟編碼解碼有關,但不是很能理解那些所謂的過程
後面有提到關於JPEG的用法(用途)跟GIF相較之下的優點(?)
"JPEG在色調及顏色平滑變化的相片或是寫實繪畫
(painting)上可以達到它最佳的效果。
在這種情況下,它通常比完全無失真方法作得更好,
仍然可以產生非常好看的影像(事實上它會比其他
一般的方法像是GIF產生更高品質的影像,
因為GIF對於線條繪畫(drawing)和圖示的圖形是無失真,
但針對全彩影像則需要極困難的量化)"
提到了線條繪圖,不禁讓我想起了一些以向量來做圖的軟體,
不知道向量圖是否也有圖片壓縮的困擾,是否也會用到JPEG之類的..
雖然這個聯想似乎怪怪的....囧
此外我試著把軟體畫出的bmp(彎彎的圖片)存成GIF與JPEG
用肉眼看的感覺,是GIF失真情況比較嚴重!
不知道該從何解釋起...(還是我又實驗錯誤??)
[以上是一點小心得跟看法]
這篇文章一不小心打到一半就送出了 囧
但我對他的印象始終停留在
1.一種影像格式(picture1.jpg)
2.使用失真壓縮(檔案比.bmp檔小很多,但是圖片會變醜)
3.相機的圖片直接使用jpg檔案
除此之外就不知道關於它的更多東西,剛好藉此來對他做個剖析
由於英文閱讀能力不佳
所以我選擇了維基百科繁體中文版做個閱讀
維基百科上說JPEG是採用把影像從RGB轉換成Y(像素亮度)U(色調)V(飽和度)
並說"比起色調與飽和度,人類的眼睛對於像素的亮度更加敏感"
並且把編碼器(encoder)建立在這個理論的基礎上
據說有用到量化...不過看到一堆數字就先眼花了@_@
看到那區時,稍微看了一下那堆數字與壓縮的相關性
似乎跟編碼解碼有關,但不是很能理解那些所謂的過程
後面有提到關於JPEG的用法(用途)跟GIF相較之下的優點(?)
"JPEG在色調及顏色平滑變化的相片或是寫實繪畫
(painting)上可以達到它最佳的效果。
在這種情況下,它通常比完全無失真方法作得更好,
仍然可以產生非常好看的影像(事實上它會比其他
一般的方法像是GIF產生更高品質的影像,
因為GIF對於線條繪畫(drawing)和圖示的圖形是無失真,
但針對全彩影像則需要極困難的量化)"
提到了線條繪圖,不禁讓我想起了一些以向量來做圖的軟體,
不知道向量圖是否也有圖片壓縮的困擾,是否也會用到JPEG之類的..
雖然這個聯想似乎怪怪的....囧
此外我試著把軟體畫出的bmp(彎彎的圖片)存成GIF與JPEG
用肉眼看的感覺,是GIF失真情況比較嚴重!
不知道該從何解釋起...(還是我又實驗錯誤??)
[以上是一點小心得跟看法]
這篇文章一不小心打到一半就送出了 囧
[week 14] JPEG
稍微整理了一下在維基百科上的JPEG資料
本來就大致上有點知道JPEG的壓縮方式,不過細讀了這個有更加清楚一些
運用在加密上,也許,可能要先把JPEG的資訊作一次解碼才把資訊藏進去,或許要想想別的作法,以下是整理的JPEG相關資料
JPEG是一種針對相片影像而廣泛使用的一種失真壓縮標準方法。使用這種壓縮的檔案格式一般也被稱為JPEG;在所有平臺上*.jpg是最普遍的。
這個名稱代表Joint Photographic Experts Group(聯合圖像專家小組)。
JPEG/JFIF是最普遍在全球資訊網(World Wide Web)上被用來儲存和傳輸照片的格式。它並不適合於線條繪圖(drawing)和其他文字或圖示(iconic)的圖形,因為它的壓縮方法用在這些圖形的型態上,會得到不適當的結果
首先,影像由RGB(紅綠藍)轉換為一種稱為YUV的不同色彩空間。
Y 成份表示一個像素的亮度
U 和 V 成份一起表示色調與飽和度。
接著減少 U 和 V 的成份(稱為"縮減取樣"或"色度抽樣"(chroma subsampling)。在JPEG上這種縮減取樣的比例可以是4:4:4(無縮減取樣),4:2:2(在水平方向 2 的倍數中取一個),以及最普遍的4:2:0(在水平和垂直方向 2 的倍數中取一個)。對於壓縮過程的剩餘部份,Y、U、和 V 都是以非常類似的方式來個別地處理。
下一步,影像中的每個成份(Y, U, V)每一個是以 8 乘以 8 的像素如磁磚般排列成為一個個的區域,每一區使用二維的離散餘弦變換(Discrete cosine transform)轉換到頻率空間。
最後作量化(Quantization)和處理失真比率情況
本來就大致上有點知道JPEG的壓縮方式,不過細讀了這個有更加清楚一些
運用在加密上,也許,可能要先把JPEG的資訊作一次解碼才把資訊藏進去,或許要想想別的作法,以下是整理的JPEG相關資料
JPEG是一種針對相片影像而廣泛使用的一種失真壓縮標準方法。使用這種壓縮的檔案格式一般也被稱為JPEG;在所有平臺上*.jpg是最普遍的。
這個名稱代表Joint Photographic Experts Group(聯合圖像專家小組)。
JPEG/JFIF是最普遍在全球資訊網(World Wide Web)上被用來儲存和傳輸照片的格式。它並不適合於線條繪圖(drawing)和其他文字或圖示(iconic)的圖形,因為它的壓縮方法用在這些圖形的型態上,會得到不適當的結果
首先,影像由RGB(紅綠藍)轉換為一種稱為YUV的不同色彩空間。
Y 成份表示一個像素的亮度
U 和 V 成份一起表示色調與飽和度。
接著減少 U 和 V 的成份(稱為"縮減取樣"或"色度抽樣"(chroma subsampling)。在JPEG上這種縮減取樣的比例可以是4:4:4(無縮減取樣),4:2:2(在水平方向 2 的倍數中取一個),以及最普遍的4:2:0(在水平和垂直方向 2 的倍數中取一個)。對於壓縮過程的剩餘部份,Y、U、和 V 都是以非常類似的方式來個別地處理。
下一步,影像中的每個成份(Y, U, V)每一個是以 8 乘以 8 的像素如磁磚般排列成為一個個的區域,每一區使用二維的離散餘弦變換(Discrete cosine transform)轉換到頻率空間。
最後作量化(Quantization)和處理失真比率情況
[week14]JPEG小簡介
各位鄉親阿
我又來啦咧了
沒錯!!
如同老師所預告的
我們在這個禮拜要進入 Information Hiding in JPEG的部份了
既然要談到在JPEG中藏資訊的方法
怎麼可以不知道JPEG是怎麼做的呢...
----以下所說的話 僅代表正cos一個人的立場 有錯的話...那也是正常的...反正我是學生嘛XDD----
1.JPEG是一種針對相片影像而廣泛使用的一種失真壓縮標準方法。
我們之前談的影像檔呢
都是以RGB的方式來紀錄color值的
可是JPEG這傢伙呢 卻是以YCbCr的方式來紀錄的喔
根據我從維基百科抄下來的話
RGB方式將所有的顏色資訊作同等的處理,雖然有最高的畫質,但由於RGB方式對傳輸頻寬
和儲存空間的消耗太大,為節省頻寬,使用色差方式來傳送與紀錄分量視訊是現在的主流。
色差在設計上利用了「人眼對明度較敏感,而對彩度較不敏感」的特性,
將視訊中的色彩資訊加以削減,轉換公式如下:
明度: Y = 0.299*R + 0.587*G + 0.114*B
色差: Cb= 0.564*(B-Y) = -0.169*R - 0.331*G + 0.500*B
Cr= 0.713*(R-Y) = 0.500*R - 0.419*G - 0.081*B
所謂的「色差」即為顏色值與明度之間的差值。轉換過後的顏色資訊量被刪減了約一半,
但由於人眼的特性,使得色差處理過後的影像與原始影像的差異很難被察覺。
最終的色差資料與RGB資料相比節省了1/3的頻寬。
嘖...
我之前都覺得YCbCr和RGB一樣...
不過就是座標軸轉換而已嘛...
為什麼它會說節省頻寬咧...
到底是哪裏被減掉啦...
反正他換成YCbCr之後阿...
因為人眼對這三個座標軸的強度感受不同阿
就可以分開壓比較多或比較少...
在Down Sampling那邊...
四個取一個跟 兩個取一個 取出來的量就不同啦...
2.8x8的陣列做處理
我不知道為什麼是8x8...
他高興吧...
3.DCT轉換
從空間域轉到頻率域...
同上...我不知道為什麼...
維基百科有關DCT的連結在這...
可是我知道DCT轉換這邊沒有失真...
4.量化
我不會解釋這邊...
可是這邊的目的也是降低資料的複雜度啦...以後比較好壓縮...
我只會舉例
像是16.1 16.2 16.3 16.5 16.8 16.75 16.9 17.1 16.2 17.25 17.33 17.54 這樣子的數列
如果都取整數值作代表的話
就會變成 16 16 16 16 16 16 16 16 17 16 17 16 17 17 17
我們可以記成 16*5 + 17*1 + 16*1 + 17*3
這樣傳輸的資料量就變少啦...
5.zig-zag
把那個8x8的陣列變成一維陣列
6.huffmancoding
我想睡覺了啦...
寫blog超累的...
我有寫了一個JPEG Decoder 的半成品...
大家有空可以玩一下...
我下次再補其他的部份好了...
我又來啦咧了
沒錯!!
如同老師所預告的
我們在這個禮拜要進入 Information Hiding in JPEG的部份了
既然要談到在JPEG中藏資訊的方法
怎麼可以不知道JPEG是怎麼做的呢...
----以下所說的話 僅代表正cos一個人的立場 有錯的話...那也是正常的...反正我是學生嘛XDD----
1.JPEG是一種針對相片影像而廣泛使用的一種失真壓縮標準方法。
我們之前談的影像檔呢
都是以RGB的方式來紀錄color值的
可是JPEG這傢伙呢 卻是以YCbCr的方式來紀錄的喔
根據我從維基百科抄下來的話
RGB方式將所有的顏色資訊作同等的處理,雖然有最高的畫質,但由於RGB方式對傳輸頻寬
和儲存空間的消耗太大,為節省頻寬,使用色差方式來傳送與紀錄分量視訊是現在的主流。
色差在設計上利用了「人眼對明度較敏感,而對彩度較不敏感」的特性,
將視訊中的色彩資訊加以削減,轉換公式如下:
明度: Y = 0.299*R + 0.587*G + 0.114*B
色差: Cb= 0.564*(B-Y) = -0.169*R - 0.331*G + 0.500*B
Cr= 0.713*(R-Y) = 0.500*R - 0.419*G - 0.081*B
所謂的「色差」即為顏色值與明度之間的差值。轉換過後的顏色資訊量被刪減了約一半,
但由於人眼的特性,使得色差處理過後的影像與原始影像的差異很難被察覺。
最終的色差資料與RGB資料相比節省了1/3的頻寬。
嘖...
我之前都覺得YCbCr和RGB一樣...
不過就是座標軸轉換而已嘛...
為什麼它會說節省頻寬咧...
到底是哪裏被減掉啦...
反正他換成YCbCr之後阿...
因為人眼對這三個座標軸的強度感受不同阿
就可以分開壓比較多或比較少...
在Down Sampling那邊...
四個取一個跟 兩個取一個 取出來的量就不同啦...
2.8x8的陣列做處理
我不知道為什麼是8x8...
他高興吧...
3.DCT轉換
從空間域轉到頻率域...
同上...我不知道為什麼...
維基百科有關DCT的連結在這...
可是我知道DCT轉換這邊沒有失真...
4.量化
我不會解釋這邊...
可是這邊的目的也是降低資料的複雜度啦...以後比較好壓縮...
我只會舉例
像是16.1 16.2 16.3 16.5 16.8 16.75 16.9 17.1 16.2 17.25 17.33 17.54 這樣子的數列
如果都取整數值作代表的話
就會變成 16 16 16 16 16 16 16 16 17 16 17 16 17 17 17
我們可以記成 16*5 + 17*1 + 16*1 + 17*3
這樣傳輸的資料量就變少啦...
5.zig-zag
把那個8x8的陣列變成一維陣列
6.huffmancoding
我想睡覺了啦...
寫blog超累的...
我有寫了一個JPEG Decoder 的半成品...
大家有空可以玩一下...
我下次再補其他的部份好了...
2007年6月4日 星期一
JPEG是甚麼?
簡而言之,
JPG / JPEG 所使用的『主要』是破壞性( 失真 )的壓縮方式,它可以針對彩色或灰階的影像進行大幅度的壓縮。是由Joint Photographic Experts Group(聯合圖像專家小組)的縮寫而來的,利用
人類的眼睛對高頻的部份較不敏感,來大量壓縮FILE的大小,JPEG也被用在各個領域上,缺點是會造成失真,但即使如此, JPEG 還是被廣泛的使用。
參考網站:
http://zh.wikipedia.org/wiki/JPEG
http://www.dcview.com.tw/photoclass/file_fmt/jpeg_1.htm
JPG / JPEG 所使用的『主要』是破壞性( 失真 )的壓縮方式,它可以針對彩色或灰階的影像進行大幅度的壓縮。是由Joint Photographic Experts Group(聯合圖像專家小組)的縮寫而來的,利用
人類的眼睛對高頻的部份較不敏感,來大量壓縮FILE的大小,JPEG也被用在各個領域上,缺點是會造成失真,但即使如此, JPEG 還是被廣泛的使用。
參考網站:
http://zh.wikipedia.org/wiki/JPEG
http://www.dcview.com.tw/photoclass/file_fmt/jpeg_1.htm
訂閱:
文章 (Atom)