2007年6月7日 星期四
Week 14 - JPEG
JPEG的格式是壓縮的,利用人類的眼睛對於高頻率的事物比較不敏感,讓壓縮後的圖片看起來不會有奇怪的感覺。它可儲存的顏色也很多,最多16百萬色,幾乎所有的數位相機都支援JPEG的影像,它精準記錄每一個像素的亮度,並取出平均色調壓縮影像,並且用某一點顏色代表周圍附近的顏色
2007年6月6日 星期三
YCbCr與YUV傻傻分不清楚
由於上個禮拜沒來上課
所以本週主要是由已經有人po的文章來學習
本週要開始討論的主題是JPEG
從大家找來的文章中發現
有人在說YUV有人在講YCbCr
雖然從維基百科中得知
基本上兩個空間是可以替換使用地(why?)
所以我想概念上應該不會有太大的差別(really?)
就Y而言指的是亮度這點沒有問題
而Cb與Cr呢?
從原文來看是說一種紅色與藍色的色差值
(Cb and Cr are the blue and red chroma components)
U與V也是類似的意思
然而這兩者都是在指色差的意思並不好懂
我想用看圖的方式也許比較能理解那是什麼
如下圖

不過這兩者本質上還是不一樣的
此兩者常被誤會但其實是兩個完全不同的格式
一個是類比系統(analog system with scale factors)
另一個則是用數位系統(digital YCbCr system)
Reference:
YUV
YCbCr
所以本週主要是由已經有人po的文章來學習
本週要開始討論的主題是JPEG
從大家找來的文章中發現
有人在說YUV有人在講YCbCr
雖然從維基百科中得知
基本上兩個空間是可以替換使用地(why?)
所以我想概念上應該不會有太大的差別(really?)
就Y而言指的是亮度這點沒有問題
而Cb與Cr呢?
從原文來看是說一種紅色與藍色的色差值
(Cb and Cr are the blue and red chroma components)
U與V也是類似的意思
然而這兩者都是在指色差的意思並不好懂
我想用看圖的方式也許比較能理解那是什麼
如下圖

不過這兩者本質上還是不一樣的
此兩者常被誤會但其實是兩個完全不同的格式
一個是類比系統(analog system with scale factors)
另一個則是用數位系統(digital YCbCr system)
Reference:
YUV
YCbCr
Week 14: JPEG
雖然平常在網路上還滿常見到JPEG,
但我對他的印象始終停留在
1.一種影像格式(picture1.jpg)
2.使用失真壓縮(檔案比.bmp檔小很多,但是圖片會變醜)
3.相機的圖片直接使用jpg檔案
除此之外就不知道關於它的更多東西,剛好藉此來對他做個剖析
由於英文閱讀能力不佳
所以我選擇了維基百科繁體中文版做個閱讀
維基百科上說JPEG是採用把影像從RGB轉換成Y(像素亮度)U(色調)V(飽和度)
並說"比起色調與飽和度,人類的眼睛對於像素的亮度更加敏感"
並且把編碼器(encoder)建立在這個理論的基礎上
據說有用到量化...不過看到一堆數字就先眼花了@_@
看到那區時,稍微看了一下那堆數字與壓縮的相關性
似乎跟編碼解碼有關,但不是很能理解那些所謂的過程
後面有提到關於JPEG的用法(用途)跟GIF相較之下的優點(?)
"JPEG在色調及顏色平滑變化的相片或是寫實繪畫
(painting)上可以達到它最佳的效果。
在這種情況下,它通常比完全無失真方法作得更好,
仍然可以產生非常好看的影像(事實上它會比其他
一般的方法像是GIF產生更高品質的影像,
因為GIF對於線條繪畫(drawing)和圖示的圖形是無失真,
但針對全彩影像則需要極困難的量化)"
提到了線條繪圖,不禁讓我想起了一些以向量來做圖的軟體,
不知道向量圖是否也有圖片壓縮的困擾,是否也會用到JPEG之類的..
雖然這個聯想似乎怪怪的....囧
此外我試著把軟體畫出的bmp(彎彎的圖片)存成GIF與JPEG
用肉眼看的感覺,是GIF失真情況比較嚴重!
不知道該從何解釋起...(還是我又實驗錯誤??)
[以上是一點小心得跟看法]
這篇文章一不小心打到一半就送出了 囧
但我對他的印象始終停留在
1.一種影像格式(picture1.jpg)
2.使用失真壓縮(檔案比.bmp檔小很多,但是圖片會變醜)
3.相機的圖片直接使用jpg檔案
除此之外就不知道關於它的更多東西,剛好藉此來對他做個剖析
由於英文閱讀能力不佳
所以我選擇了維基百科繁體中文版做個閱讀
維基百科上說JPEG是採用把影像從RGB轉換成Y(像素亮度)U(色調)V(飽和度)
並說"比起色調與飽和度,人類的眼睛對於像素的亮度更加敏感"
並且把編碼器(encoder)建立在這個理論的基礎上
據說有用到量化...不過看到一堆數字就先眼花了@_@
看到那區時,稍微看了一下那堆數字與壓縮的相關性
似乎跟編碼解碼有關,但不是很能理解那些所謂的過程
後面有提到關於JPEG的用法(用途)跟GIF相較之下的優點(?)
"JPEG在色調及顏色平滑變化的相片或是寫實繪畫
(painting)上可以達到它最佳的效果。
在這種情況下,它通常比完全無失真方法作得更好,
仍然可以產生非常好看的影像(事實上它會比其他
一般的方法像是GIF產生更高品質的影像,
因為GIF對於線條繪畫(drawing)和圖示的圖形是無失真,
但針對全彩影像則需要極困難的量化)"
提到了線條繪圖,不禁讓我想起了一些以向量來做圖的軟體,
不知道向量圖是否也有圖片壓縮的困擾,是否也會用到JPEG之類的..
雖然這個聯想似乎怪怪的....囧
此外我試著把軟體畫出的bmp(彎彎的圖片)存成GIF與JPEG
用肉眼看的感覺,是GIF失真情況比較嚴重!
不知道該從何解釋起...(還是我又實驗錯誤??)
[以上是一點小心得跟看法]
這篇文章一不小心打到一半就送出了 囧
Week 14 PPT_version2
原本應該上週就要發表的
但因為畢業考給自己了一個理由
拖了一個禮拜
其實就是發懶了= =
修改的主要內容如下
1.更正投影片內容
2.條列式
3.動畫輔助
4.擷取出來關鍵字或句
連結如下:
Introduction_V2
但因為畢業考給自己了一個理由
拖了一個禮拜
其實就是發懶了= =
修改的主要內容如下
1.更正投影片內容
2.條列式
3.動畫輔助
4.擷取出來關鍵字或句
連結如下:
Introduction_V2
[week 14] JPEG
稍微整理了一下在維基百科上的JPEG資料
本來就大致上有點知道JPEG的壓縮方式,不過細讀了這個有更加清楚一些
運用在加密上,也許,可能要先把JPEG的資訊作一次解碼才把資訊藏進去,或許要想想別的作法,以下是整理的JPEG相關資料
JPEG是一種針對相片影像而廣泛使用的一種失真壓縮標準方法。使用這種壓縮的檔案格式一般也被稱為JPEG;在所有平臺上*.jpg是最普遍的。
這個名稱代表Joint Photographic Experts Group(聯合圖像專家小組)。
JPEG/JFIF是最普遍在全球資訊網(World Wide Web)上被用來儲存和傳輸照片的格式。它並不適合於線條繪圖(drawing)和其他文字或圖示(iconic)的圖形,因為它的壓縮方法用在這些圖形的型態上,會得到不適當的結果
首先,影像由RGB(紅綠藍)轉換為一種稱為YUV的不同色彩空間。
Y 成份表示一個像素的亮度
U 和 V 成份一起表示色調與飽和度。
接著減少 U 和 V 的成份(稱為"縮減取樣"或"色度抽樣"(chroma subsampling)。在JPEG上這種縮減取樣的比例可以是4:4:4(無縮減取樣),4:2:2(在水平方向 2 的倍數中取一個),以及最普遍的4:2:0(在水平和垂直方向 2 的倍數中取一個)。對於壓縮過程的剩餘部份,Y、U、和 V 都是以非常類似的方式來個別地處理。
下一步,影像中的每個成份(Y, U, V)每一個是以 8 乘以 8 的像素如磁磚般排列成為一個個的區域,每一區使用二維的離散餘弦變換(Discrete cosine transform)轉換到頻率空間。
最後作量化(Quantization)和處理失真比率情況
本來就大致上有點知道JPEG的壓縮方式,不過細讀了這個有更加清楚一些
運用在加密上,也許,可能要先把JPEG的資訊作一次解碼才把資訊藏進去,或許要想想別的作法,以下是整理的JPEG相關資料
JPEG是一種針對相片影像而廣泛使用的一種失真壓縮標準方法。使用這種壓縮的檔案格式一般也被稱為JPEG;在所有平臺上*.jpg是最普遍的。
這個名稱代表Joint Photographic Experts Group(聯合圖像專家小組)。
JPEG/JFIF是最普遍在全球資訊網(World Wide Web)上被用來儲存和傳輸照片的格式。它並不適合於線條繪圖(drawing)和其他文字或圖示(iconic)的圖形,因為它的壓縮方法用在這些圖形的型態上,會得到不適當的結果
首先,影像由RGB(紅綠藍)轉換為一種稱為YUV的不同色彩空間。
Y 成份表示一個像素的亮度
U 和 V 成份一起表示色調與飽和度。
接著減少 U 和 V 的成份(稱為"縮減取樣"或"色度抽樣"(chroma subsampling)。在JPEG上這種縮減取樣的比例可以是4:4:4(無縮減取樣),4:2:2(在水平方向 2 的倍數中取一個),以及最普遍的4:2:0(在水平和垂直方向 2 的倍數中取一個)。對於壓縮過程的剩餘部份,Y、U、和 V 都是以非常類似的方式來個別地處理。
下一步,影像中的每個成份(Y, U, V)每一個是以 8 乘以 8 的像素如磁磚般排列成為一個個的區域,每一區使用二維的離散餘弦變換(Discrete cosine transform)轉換到頻率空間。
最後作量化(Quantization)和處理失真比率情況
[week14]JPEG小簡介
各位鄉親阿
我又來啦咧了
沒錯!!
如同老師所預告的
我們在這個禮拜要進入 Information Hiding in JPEG的部份了
既然要談到在JPEG中藏資訊的方法
怎麼可以不知道JPEG是怎麼做的呢...
----以下所說的話 僅代表正cos一個人的立場 有錯的話...那也是正常的...反正我是學生嘛XDD----
1.JPEG是一種針對相片影像而廣泛使用的一種失真壓縮標準方法。
我們之前談的影像檔呢
都是以RGB的方式來紀錄color值的
可是JPEG這傢伙呢 卻是以YCbCr的方式來紀錄的喔
根據我從維基百科抄下來的話
RGB方式將所有的顏色資訊作同等的處理,雖然有最高的畫質,但由於RGB方式對傳輸頻寬
和儲存空間的消耗太大,為節省頻寬,使用色差方式來傳送與紀錄分量視訊是現在的主流。
色差在設計上利用了「人眼對明度較敏感,而對彩度較不敏感」的特性,
將視訊中的色彩資訊加以削減,轉換公式如下:
明度: Y = 0.299*R + 0.587*G + 0.114*B
色差: Cb= 0.564*(B-Y) = -0.169*R - 0.331*G + 0.500*B
Cr= 0.713*(R-Y) = 0.500*R - 0.419*G - 0.081*B
所謂的「色差」即為顏色值與明度之間的差值。轉換過後的顏色資訊量被刪減了約一半,
但由於人眼的特性,使得色差處理過後的影像與原始影像的差異很難被察覺。
最終的色差資料與RGB資料相比節省了1/3的頻寬。
嘖...
我之前都覺得YCbCr和RGB一樣...
不過就是座標軸轉換而已嘛...
為什麼它會說節省頻寬咧...
到底是哪裏被減掉啦...
反正他換成YCbCr之後阿...
因為人眼對這三個座標軸的強度感受不同阿
就可以分開壓比較多或比較少...
在Down Sampling那邊...
四個取一個跟 兩個取一個 取出來的量就不同啦...
2.8x8的陣列做處理
我不知道為什麼是8x8...
他高興吧...
3.DCT轉換
從空間域轉到頻率域...
同上...我不知道為什麼...
維基百科有關DCT的連結在這...
可是我知道DCT轉換這邊沒有失真...
4.量化
我不會解釋這邊...
可是這邊的目的也是降低資料的複雜度啦...以後比較好壓縮...
我只會舉例
像是16.1 16.2 16.3 16.5 16.8 16.75 16.9 17.1 16.2 17.25 17.33 17.54 這樣子的數列
如果都取整數值作代表的話
就會變成 16 16 16 16 16 16 16 16 17 16 17 16 17 17 17
我們可以記成 16*5 + 17*1 + 16*1 + 17*3
這樣傳輸的資料量就變少啦...
5.zig-zag
把那個8x8的陣列變成一維陣列
6.huffmancoding
我想睡覺了啦...
寫blog超累的...
我有寫了一個JPEG Decoder 的半成品...
大家有空可以玩一下...
我下次再補其他的部份好了...
我又來啦咧了
沒錯!!
如同老師所預告的
我們在這個禮拜要進入 Information Hiding in JPEG的部份了
既然要談到在JPEG中藏資訊的方法
怎麼可以不知道JPEG是怎麼做的呢...
----以下所說的話 僅代表正cos一個人的立場 有錯的話...那也是正常的...反正我是學生嘛XDD----
1.JPEG是一種針對相片影像而廣泛使用的一種失真壓縮標準方法。
我們之前談的影像檔呢
都是以RGB的方式來紀錄color值的
可是JPEG這傢伙呢 卻是以YCbCr的方式來紀錄的喔
根據我從維基百科抄下來的話
RGB方式將所有的顏色資訊作同等的處理,雖然有最高的畫質,但由於RGB方式對傳輸頻寬
和儲存空間的消耗太大,為節省頻寬,使用色差方式來傳送與紀錄分量視訊是現在的主流。
色差在設計上利用了「人眼對明度較敏感,而對彩度較不敏感」的特性,
將視訊中的色彩資訊加以削減,轉換公式如下:
明度: Y = 0.299*R + 0.587*G + 0.114*B
色差: Cb= 0.564*(B-Y) = -0.169*R - 0.331*G + 0.500*B
Cr= 0.713*(R-Y) = 0.500*R - 0.419*G - 0.081*B
所謂的「色差」即為顏色值與明度之間的差值。轉換過後的顏色資訊量被刪減了約一半,
但由於人眼的特性,使得色差處理過後的影像與原始影像的差異很難被察覺。
最終的色差資料與RGB資料相比節省了1/3的頻寬。
嘖...
我之前都覺得YCbCr和RGB一樣...
不過就是座標軸轉換而已嘛...
為什麼它會說節省頻寬咧...
到底是哪裏被減掉啦...
反正他換成YCbCr之後阿...
因為人眼對這三個座標軸的強度感受不同阿
就可以分開壓比較多或比較少...
在Down Sampling那邊...
四個取一個跟 兩個取一個 取出來的量就不同啦...
2.8x8的陣列做處理
我不知道為什麼是8x8...
他高興吧...
3.DCT轉換
從空間域轉到頻率域...
同上...我不知道為什麼...
維基百科有關DCT的連結在這...
可是我知道DCT轉換這邊沒有失真...
4.量化
我不會解釋這邊...
可是這邊的目的也是降低資料的複雜度啦...以後比較好壓縮...
我只會舉例
像是16.1 16.2 16.3 16.5 16.8 16.75 16.9 17.1 16.2 17.25 17.33 17.54 這樣子的數列
如果都取整數值作代表的話
就會變成 16 16 16 16 16 16 16 16 17 16 17 16 17 17 17
我們可以記成 16*5 + 17*1 + 16*1 + 17*3
這樣傳輸的資料量就變少啦...
5.zig-zag
把那個8x8的陣列變成一維陣列
6.huffmancoding
我想睡覺了啦...
寫blog超累的...
我有寫了一個JPEG Decoder 的半成品...
大家有空可以玩一下...
我下次再補其他的部份好了...
2007年6月4日 星期一
JPEG是甚麼?
簡而言之,
JPG / JPEG 所使用的『主要』是破壞性( 失真 )的壓縮方式,它可以針對彩色或灰階的影像進行大幅度的壓縮。是由Joint Photographic Experts Group(聯合圖像專家小組)的縮寫而來的,利用
人類的眼睛對高頻的部份較不敏感,來大量壓縮FILE的大小,JPEG也被用在各個領域上,缺點是會造成失真,但即使如此, JPEG 還是被廣泛的使用。
參考網站:
http://zh.wikipedia.org/wiki/JPEG
http://www.dcview.com.tw/photoclass/file_fmt/jpeg_1.htm
JPG / JPEG 所使用的『主要』是破壞性( 失真 )的壓縮方式,它可以針對彩色或灰階的影像進行大幅度的壓縮。是由Joint Photographic Experts Group(聯合圖像專家小組)的縮寫而來的,利用
人類的眼睛對高頻的部份較不敏感,來大量壓縮FILE的大小,JPEG也被用在各個領域上,缺點是會造成失真,但即使如此, JPEG 還是被廣泛的使用。
參考網站:
http://zh.wikipedia.org/wiki/JPEG
http://www.dcview.com.tw/photoclass/file_fmt/jpeg_1.htm
訂閱:
文章 (Atom)