論文基本資料:
研討會年份:ICME 2007 Beijing,China
作者:Liu Yuling, Sun Xingming, Gan Can, Wang Hong
出處:School of Computer and Communication Hunan University, Changsha, China
資料來源:Authorized licensed use limited to: Ming Chuan University Library. Downloaded on October 21, 2009 at 20:38 from IEEE Xplore. Restrictions apply.
PDF檔有記錄我甚麼時候下載的
這篇論文之前太仰賴翻譯
所以有讀的不知所云
這次叫認真的直接去讀原文paper
似乎比較能抓到一點重點
在摘要部分指出
要運用現有的中國訊息處理的方法
提出一套中國語言隱藏學的演算方法
演算法要根據同義詞和同一個字的變形做為替代
然後透過中國詞彙的分析去消除替代字跟周圍字在文中上下文的作用
看到這我認為
會不會是高興換成快樂這意思吧?
然後介紹那部分論文中就闡述了
使用同義詞的概念
在製作一套標準的set時
有提到很多定義
例如 同一詞彙不同的型式是不同的字詞 包括聲音、押韻
文字敘述總是有點抽象讓人難懂
沒圖沒真相
哈 果然看到範例圖就一目了然
大致看完這篇paper後
我覺得這方法並不新穎
在外國也常有同義詞替換 變成一篇具有隱藏資訊的媒體
不過這算是比較少見
替中文字設計 定義一套標準的論文
我覺得難度有點高
像是論文中提到
同義詞中 手動刪去不常使用的詞彙
這項工程就滿抽象的
因為中國各地有很多中俚語 比較口語化的表達方式
也許在A地 某個詞很常見
那在B地卻沒見過
那這樣統計上就沒有一致的依據
我個人認為中國文字之強大
難以為其設計一套標準
附件論文pdf
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言