第一次自評感覺還滿妙的整體上
雖然幾乎都有來上課
但上課沒說很進入狀況
又缺於和其他同學以及老師討論
在BLOG的貼文上,又沒勤找資料
就得不到什麼感觸寫出文章來
全部包含這篇文章,全部也才貼出五篇 數量真的還滿少的
上課採討論方式
可以增加很多師生互動
觀念比較不會被全部被牽的走
如果有認真思考一下 就會比較有自己想法
所以大概只打給自己65分
2007年6月21日 星期四
2007年6月19日 星期二
week16
問題1: 針對每一個經 DCT…
Ans:左上是低頻分部地方,越往右下則屬高頻,由黃老師本週對JPEG的解釋,image redundancy有三個主要原因,其中high frequency components,就是在說明眼睛看不清,頻率高,去表示就沒什麼意義,還要用很多bits數去表示,就是一種浪費,所以我想在做量化時,和一個特定量化矩陣相除,這一步驟為何越往右下,所要除的值就越大,就是為了相除之後的結果值越小,就可以用比較少的bits數,去儲存影像,而對低頻眼睛看的比較清,所以就需要較多bits去表示,更像原圖,所以特定量化矩陣左上的值才會比較小,才比較不會失真太多。
問題2: 量化後的係數矩陣中, 存在許多個0…
Ans:表示0的情形,因該是越往右下呈現越多這樣情形,因該是要減少高頻用過多bits數去儲存。
問題3: 用 Zigzag 的方式….
Ans:因該是為了電腦好處理,將二維轉換為一維,在轉成2進位表示方法,這樣就轉換成一長串10表示,進去給電腦處理;以Z字型排列,這樣的取係數方法,就等於從低頻慢慢取到高頻,高頻部分常常被量化成0所以就不用表示,只要看到EOB,因該也有個特定的2進位表示,電腦處理到這串位元,就知道後面皆為0了,一直取0將矩陣補齊成8*8,就可以代表出這個矩陣了,就不用在浪費多餘bits數,去表示後面皆是0的部分,來減少檔案大小。
問題4:為什麼JPEG壓縮…..
Ans:entropy coding就是壓縮的最後一步驟,不失真因該就是為了能再解壓縮回來,每個一長串2進位表示,皆是8*8矩陣,在相乘特定的量化矩陣回來,接的反離散餘弦轉換,在加128回來,就成為原初8*8影像;這部分有些許疑問,是不是圖片只有在第一次JPEG做編碼會失真而已,接下來怎麼壓縮跟解壓縮都不會在改變圖片了??我想因該是這樣,因為第一次做壓縮時,矩陣的係數已經算是被整理過一次,接下來再怎麼壓縮或解壓縮,係數再怎麼轉還是那些在轉換。
問題5:熵編碼(entropy coding)的熵所….
Ans:不知道網路上找的,定義離散無記憶資料源(discrete memoryless source, DMS),一個最簡單的資料源模型。
Ans:左上是低頻分部地方,越往右下則屬高頻,由黃老師本週對JPEG的解釋,image redundancy有三個主要原因,其中high frequency components,就是在說明眼睛看不清,頻率高,去表示就沒什麼意義,還要用很多bits數去表示,就是一種浪費,所以我想在做量化時,和一個特定量化矩陣相除,這一步驟為何越往右下,所要除的值就越大,就是為了相除之後的結果值越小,就可以用比較少的bits數,去儲存影像,而對低頻眼睛看的比較清,所以就需要較多bits去表示,更像原圖,所以特定量化矩陣左上的值才會比較小,才比較不會失真太多。
問題2: 量化後的係數矩陣中, 存在許多個0…
Ans:表示0的情形,因該是越往右下呈現越多這樣情形,因該是要減少高頻用過多bits數去儲存。
問題3: 用 Zigzag 的方式….
Ans:因該是為了電腦好處理,將二維轉換為一維,在轉成2進位表示方法,這樣就轉換成一長串10表示,進去給電腦處理;以Z字型排列,這樣的取係數方法,就等於從低頻慢慢取到高頻,高頻部分常常被量化成0所以就不用表示,只要看到EOB,因該也有個特定的2進位表示,電腦處理到這串位元,就知道後面皆為0了,一直取0將矩陣補齊成8*8,就可以代表出這個矩陣了,就不用在浪費多餘bits數,去表示後面皆是0的部分,來減少檔案大小。
問題4:為什麼JPEG壓縮…..
Ans:entropy coding就是壓縮的最後一步驟,不失真因該就是為了能再解壓縮回來,每個一長串2進位表示,皆是8*8矩陣,在相乘特定的量化矩陣回來,接的反離散餘弦轉換,在加128回來,就成為原初8*8影像;這部分有些許疑問,是不是圖片只有在第一次JPEG做編碼會失真而已,接下來怎麼壓縮跟解壓縮都不會在改變圖片了??我想因該是這樣,因為第一次做壓縮時,矩陣的係數已經算是被整理過一次,接下來再怎麼壓縮或解壓縮,係數再怎麼轉還是那些在轉換。
問題5:熵編碼(entropy coding)的熵所….
Ans:不知道網路上找的,定義離散無記憶資料源(discrete memoryless source, DMS),一個最簡單的資料源模型。
2007年6月8日 星期五
week15
這週換開始討論jpeg,其實想法因該還是滿不清楚的,就先寫段文章順便統整一下想法,下週觀念要是更清楚點,在改正了,有錯也請回應告知~謝謝
首先,色彩空間轉換
就如同老師講的 不同的運用 就會有不同的方法去表示 即jpeg就用YUV方法,去表示色彩空間
接的,縮減取樣
利用對色調和飽和度,眼睛對此沒有這麼高的靈敏度 所以就減少這方面的資料 來達到 縮減檔案的目的,原先以為要是採無縮減取樣的方法,那圖片不就不會失真了,後來去問老師才知此step雖不失真,但經過DC轉換後還是會失真
DCT
太過於數學 所以就沒什麼討論,左上角是數值最大的,我猜是為了知道什麼數值最大是什麼,就知道這圖檔,最長是用幾bits去表示,就不會多浪費更多bits數去紀錄,而顯示的都是0,浪費檔案空間
量化
圖片經過DC轉換後,所得到的矩陣在去跟一個受過設計的量化矩陣各別位置皆去相除,這樣所出來的矩陣,每個數值就都別具有意義,8*8這樣即有64量化矩陣等待處理,至於矩陣左上為何皆低頻,右下皆高頻居多,那天聽的滿模糊的,大概寫一下現在想法,文章有談到,人對高頻率辨識能力比較差,所以可以在那降低資訊數量,來縮減檔案,所以這就為何右下高頻部分會皆0居多,原因就是資料被裁減掉,而對低頻辨識能力比較好點,所以就相對需要更多資訊數量去紀錄表示,來讓畫面呈現更像原圖, 所以猜想左上到右下,數值會越來越偏向0因該就是這樣,而左上低頻右下高頻,就可能跟老師講的這矩陣是受過設計的,所以分布才呈現這樣
顏色越相鄰DC值越強,老師有舉例白色,同顏色所以皆相鄰在一起,DC值很大,其餘皆是0,因為這是高頻率的顏色;這樣要是換用低頻率的單一顏色,因還是皆相鄰在一起,DC值還是一樣大,而且是低頻,不能去裁減掉很多資訊,這樣檔案不就比較大嗎???所以高頻率亮度變動,是指顏色的頻率,還是顏色間變動的頻率,這點就滿不清楚的
後來自己用小畫家去做測試,儲存全紫跟全紅的jpeg圖案,發現兩邊檔案大小相同皆是3.61KB,後來在做一張圖,紫跟紅相間的圖案檔案就大很多是576KB,所以高頻率變動是指顏色間變動的頻率,所以同顏色間都沒有變動,這屬於低頻,所以低頻部分特高,所以DC才會特別大,越往右下是高頻部分,因都低頻沒有高頻所以才都是0,是這樣嗎???但既然是低頻,這樣資訊就不能減掉很多,這樣資訊裡因該很多位置都要有值去紀錄阿,怎會這麼多0,所以是上面低頻跟高頻有分開看,還是下面觀念是這正確,還是都錯誤,老師下週可以的話,可以說明一下,同顏色的矩陣裡為何是這樣,今天寫到這 越想越亂= =
首先,色彩空間轉換
就如同老師講的 不同的運用 就會有不同的方法去表示 即jpeg就用YUV方法,去表示色彩空間
接的,縮減取樣
利用對色調和飽和度,眼睛對此沒有這麼高的靈敏度 所以就減少這方面的資料 來達到 縮減檔案的目的,原先以為要是採無縮減取樣的方法,那圖片不就不會失真了,後來去問老師才知此step雖不失真,但經過DC轉換後還是會失真
DCT
太過於數學 所以就沒什麼討論,左上角是數值最大的,我猜是為了知道什麼數值最大是什麼,就知道這圖檔,最長是用幾bits去表示,就不會多浪費更多bits數去紀錄,而顯示的都是0,浪費檔案空間
量化
圖片經過DC轉換後,所得到的矩陣在去跟一個受過設計的量化矩陣各別位置皆去相除,這樣所出來的矩陣,每個數值就都別具有意義,8*8這樣即有64量化矩陣等待處理,至於矩陣左上為何皆低頻,右下皆高頻居多,那天聽的滿模糊的,大概寫一下現在想法,文章有談到,人對高頻率辨識能力比較差,所以可以在那降低資訊數量,來縮減檔案,所以這就為何右下高頻部分會皆0居多,原因就是資料被裁減掉,而對低頻辨識能力比較好點,所以就相對需要更多資訊數量去紀錄表示,來讓畫面呈現更像原圖, 所以猜想左上到右下,數值會越來越偏向0因該就是這樣,而左上低頻右下高頻,就可能跟老師講的這矩陣是受過設計的,所以分布才呈現這樣
顏色越相鄰DC值越強,老師有舉例白色,同顏色所以皆相鄰在一起,DC值很大,其餘皆是0,因為這是高頻率的顏色;這樣要是換用低頻率的單一顏色,因還是皆相鄰在一起,DC值還是一樣大,而且是低頻,不能去裁減掉很多資訊,這樣檔案不就比較大嗎???所以高頻率亮度變動,是指顏色的頻率,還是顏色間變動的頻率,這點就滿不清楚的
後來自己用小畫家去做測試,儲存全紫跟全紅的jpeg圖案,發現兩邊檔案大小相同皆是3.61KB,後來在做一張圖,紫跟紅相間的圖案檔案就大很多是576KB,所以高頻率變動是指顏色間變動的頻率,所以同顏色間都沒有變動,這屬於低頻,所以低頻部分特高,所以DC才會特別大,越往右下是高頻部分,因都低頻沒有高頻所以才都是0,是這樣嗎???但既然是低頻,這樣資訊就不能減掉很多,這樣資訊裡因該很多位置都要有值去紀錄阿,怎會這麼多0,所以是上面低頻跟高頻有分開看,還是下面觀念是這正確,還是都錯誤,老師下週可以的話,可以說明一下,同顏色的矩陣裡為何是這樣,今天寫到這 越想越亂= =
week2
利用s-tool工具
可將圖片格式為BMP和GIF檔,以及音效格式為WMV檔
當作是要隱藏資訊的檔案 遷入到不相干的圖片中 去隱藏這些訊息,
也可以加密,要有密碼的人 才會解密 得到 此圖裡 隱藏的另一個訊息
假如你要藏的 資訊過大 大到無法 遷入到那圖片中 系統就會顯示訊息
說明無法將此圖 資訊 藏到此檔案裡
但發現 遷入訊息前跟後 圖片的亮度會有所差異
前者較為明亮鮮豔點 後者較為暗淡
可能是從256色降至32色
然後在將欲隱藏的訊息分別遷入像素的各R、G、B最後一位元裡,
每個位元都有兩種可能 一種就是原本相同不用改變 一種就是不同
需要改成要隱藏訊息的位元,所以就在可變可不變之下最多差異是
2*2*2=8,最多情況就是到<=256色情況,所以可利用的顏色數大多
不如原先256色多,大多情形 在遷入隱藏訊息之後呈現的圖片,
才比較黯淡。
可將圖片格式為BMP和GIF檔,以及音效格式為WMV檔
當作是要隱藏資訊的檔案 遷入到不相干的圖片中 去隱藏這些訊息,
也可以加密,要有密碼的人 才會解密 得到 此圖裡 隱藏的另一個訊息
假如你要藏的 資訊過大 大到無法 遷入到那圖片中 系統就會顯示訊息
說明無法將此圖 資訊 藏到此檔案裡
但發現 遷入訊息前跟後 圖片的亮度會有所差異
前者較為明亮鮮豔點 後者較為暗淡
可能是從256色降至32色
然後在將欲隱藏的訊息分別遷入像素的各R、G、B最後一位元裡,
每個位元都有兩種可能 一種就是原本相同不用改變 一種就是不同
需要改成要隱藏訊息的位元,所以就在可變可不變之下最多差異是
2*2*2=8,最多情況就是到<=256色情況,所以可利用的顏色數大多
不如原先256色多,大多情形 在遷入隱藏訊息之後呈現的圖片,
才比較黯淡。
week1
第一篇資訊隱藏心得
上週講的影像格式跟壓縮方法都不是很了解,所以去網路上察看一些相關的資訊,希望這週更能融入聽懂老師教什麼,畢竟這門因該是我,第一次修多媒體學程的科目
真正去查了才知道有數十種以上格式,不然平常有應用到
的因該只有pics跟jpg格式,因為要把相片檔案縮小,跟
gif因常看到會動的圖檔都是此格式
現在一一列出這週看的檔案格式,觀看了解後的心得: bmp:懂了點陣圖的意思,跟電視上看到骨牌秀倒下呈現出
一副圖的道理一樣,像要做800*600,4bits的圖等於要48萬
個骨牌去排,而且規定只有16個索引顏色,顏色越多越逼
真,自然而然更需要更多bits數, 檔案野會越來越大,
共分24bits即為全彩(1677萬色)、16bits(65536色)、
8bits(256色)、4bits(16色)、1bits(單色),但這圖檔不能壓縮
Jpg: 幾乎所有數位相機都支援jpg記錄影像,也可支援24bits,
至於準確度跟壓縮比會成反比,想要較高的解析度就需要
比較低的壓縮比,自然而然也需要更多硬碟空間存放所以看
個人需求而去抉擇,利用數位餘弦轉換法(DCT)來壓縮,這
是會失真的壓縮格式,所以每次調整最好是自己另存新檔,
不然再重覆修改圖片下,可能精準度會越來越差
Gif:這壓縮方法是改良的藍波- 立夫- 衛曲法,以可變長度碼來編碼其索引值,可有效的節省壓縮後的空間,提高壓縮的比例
藍波- 立夫- 衛曲法又稱字串表(String Table) 壓縮法,基本的原理
是將原始影像資料中重複的字串編成一個表,然後再利用表上的
索引值來取代原始影像資料中的字串,由於索引值的體積遠比原始
影像中的字串體積來的小
這跟今天翻書跟一個最基本的壓縮原理很像L開頭的我沒記忘了….,比如一行字串是aaaaabbbbccccdddd假設需要17個單位去儲存,被壓縮成表示成 5個a 4個b 4個c 4個d,只需12個單位就儲存,大家還是明白本意,但儲放空間就少了30%,達到壓縮的效果,解壓縮時5就像是索引值,a就像是符號,就像是看到索引是5,就要印出a這個符號5次,就達到解壓縮的效果,也不失真,
所以我想gif格式為什麼不失真的原因就在這, 將重複字串編成一個表,之後在依索引值,知道這字串要放到哪個位置上去,所以就跟原本圖一樣不會失真了,而又是改良的可以改變長度碼,就不會受限於固定長度,造成小缺口不能放資料,造成不用浪費空間
至於下面那段話 它還具透明功能,只要指定色盤中的某種顏色為透明色即可,(例如:人在藍色布幕前拍照,將藍色設定為透明,就去掉藍色部分),適用於人或商品的影像去背處理 不太能怎能了解表達的意思,老師有看到在教一下,謝謝
下面這三個表格數據是從網路找到的,由256色影像壓縮結果可以看出,為什麼現在逛網頁常看到的圖檔,我想因該是因為壓縮效果最好而且還不失真,大大減少了檔案大小也加快開啟網頁的速度
而另外兩個數據則是看出有失真的壓縮率遠比無失真的壓縮率好,jpg在使用者幾乎無法察覺的失真情況下,jpg 的壓縮率可以達到5% ~15%,所以網路上的圖片格式常常都是jpg格式,對加快網路速度方面也有幫助


這是我參考的網址:
http://content.edu.tw/senior/life_tech/tc_t2/inform/ref/knowfile.htm
http://tw.knowledge.yahoo.com/question/?qid=1005020702402
http://www.cs.ccu.edu.tw/~ccc/article/image_compression.htm
上週講的影像格式跟壓縮方法都不是很了解,所以去網路上察看一些相關的資訊,希望這週更能融入聽懂老師教什麼,畢竟這門因該是我,第一次修多媒體學程的科目
真正去查了才知道有數十種以上格式,不然平常有應用到
的因該只有pics跟jpg格式,因為要把相片檔案縮小,跟
gif因常看到會動的圖檔都是此格式
現在一一列出這週看的檔案格式,觀看了解後的心得: bmp:懂了點陣圖的意思,跟電視上看到骨牌秀倒下呈現出
一副圖的道理一樣,像要做800*600,4bits的圖等於要48萬
個骨牌去排,而且規定只有16個索引顏色,顏色越多越逼
真,自然而然更需要更多bits數, 檔案野會越來越大,
共分24bits即為全彩(1677萬色)、16bits(65536色)、
8bits(256色)、4bits(16色)、1bits(單色),但這圖檔不能壓縮
Jpg: 幾乎所有數位相機都支援jpg記錄影像,也可支援24bits,
至於準確度跟壓縮比會成反比,想要較高的解析度就需要
比較低的壓縮比,自然而然也需要更多硬碟空間存放所以看
個人需求而去抉擇,利用數位餘弦轉換法(DCT)來壓縮,這
是會失真的壓縮格式,所以每次調整最好是自己另存新檔,
不然再重覆修改圖片下,可能精準度會越來越差
Gif:這壓縮方法是改良的藍波- 立夫- 衛曲法,以可變長度碼來編碼其索引值,可有效的節省壓縮後的空間,提高壓縮的比例
藍波- 立夫- 衛曲法又稱字串表(String Table) 壓縮法,基本的原理
是將原始影像資料中重複的字串編成一個表,然後再利用表上的
索引值來取代原始影像資料中的字串,由於索引值的體積遠比原始
影像中的字串體積來的小
這跟今天翻書跟一個最基本的壓縮原理很像L開頭的我沒記忘了….,比如一行字串是aaaaabbbbccccdddd假設需要17個單位去儲存,被壓縮成表示成 5個a 4個b 4個c 4個d,只需12個單位就儲存,大家還是明白本意,但儲放空間就少了30%,達到壓縮的效果,解壓縮時5就像是索引值,a就像是符號,就像是看到索引是5,就要印出a這個符號5次,就達到解壓縮的效果,也不失真,
所以我想gif格式為什麼不失真的原因就在這, 將重複字串編成一個表,之後在依索引值,知道這字串要放到哪個位置上去,所以就跟原本圖一樣不會失真了,而又是改良的可以改變長度碼,就不會受限於固定長度,造成小缺口不能放資料,造成不用浪費空間
至於下面那段話 它還具透明功能,只要指定色盤中的某種顏色為透明色即可,(例如:人在藍色布幕前拍照,將藍色設定為透明,就去掉藍色部分),適用於人或商品的影像去背處理 不太能怎能了解表達的意思,老師有看到在教一下,謝謝
下面這三個表格數據是從網路找到的,由256色影像壓縮結果可以看出,為什麼現在逛網頁常看到的圖檔,我想因該是因為壓縮效果最好而且還不失真,大大減少了檔案大小也加快開啟網頁的速度
而另外兩個數據則是看出有失真的壓縮率遠比無失真的壓縮率好,jpg在使用者幾乎無法察覺的失真情況下,jpg 的壓縮率可以達到5% ~15%,所以網路上的圖片格式常常都是jpg格式,對加快網路速度方面也有幫助
這是我參考的網址:
http://content.edu.tw/senior/life_tech/tc_t2/inform/ref/knowfile.htm
http://tw.knowledge.yahoo.com/question/?qid=1005020702402
http://www.cs.ccu.edu.tw/~ccc/article/image_compression.htm
訂閱:
文章 (Atom)