2007年11月28日 星期三

腐女阿綿之F4185救急OCR軟體實測 <摘自mobile01>

摘自 mobile01 (腐女阿綿之F4185救急OCR軟體實測 )
http://www.mobile01.com/topicdetail.php?f=116&t=434913

最近阿綿發現妹妹有如人間蒸發,許久不見她的蹤影,正在覺得疑惑的當下老妹就自己送上門啦!

”姐,救我”頂著兩顆超大熊貓眼,扛著一堆書,嚇了阿綿一大跳。原來最近綿妹在趕研究所的報告,光是找資料就花了整整三天,好不容易終於要做到資料統整的階段,但光參考書籍就有17本,上面貼著密密麻麻的標籤紙,阿綿看到差點沒昏倒。orz

這麼多本都要整理成一份電子檔,用KEY的肯定來不及,只好問問我家阿宅有沒有什麼好方法。

阿宅說可以用掃描器掃進電腦裡作文字辨識,如果是HP的複合機有附一種OCR軟體,就不用上網去抓什麼丹青了。

阿綿只好捨命陪君子負責掃描的工作,綿妹就來整理摟~無奈

正好上次買的F4185又再度派上用場,馬上打開來試試。

白白胖胖F4185XD

先放入一本書,掃一段文章試試…
這篇正好都是中文
點選桌面上HP解決方案中心


選擇掃描文件

出現掃描文件的視窗,選擇『掃描至Word or WordPad』,執行OCR的字幕就出現摟!
再來就是要選擇掃描文件設定
然後到『掃描文件設定』的地方選擇OCR的語言,沒選之前他是顯示英文的!
如果覺得解析度不夠的話也可以把上面DPI的選項值調高一些。
確定之後他就開始掃描摟~

先選取需要的文字範圍進行掃描....確定沒有下一頁之後,它就會開始轉檔…
轉好的Word檔

放大內文字體,和原始檔比較起來純文字的辨識度表現還不錯,正確度可達100%歡呼 並顯示可以直接編輯的箭號。勝利


原文檔案


那中英文交錯呢?
辨識度也非常不錯,除了格式沒錯之外,字體的部份也非常正確
純日文掃描,可以把語言辨識改成日文

灰熊厲害,連日文注音都一清二楚
比較原圖,段落上距離分的較開,不過沒關西,反正是要字

碰到直書的,不知道直書的雜誌文件行不行

原來排版是直的,但妹妹文章是用一般的橫書,所以先勾選『不保留格式』來試試看他會不會整理成橫的。

掃好摟~是變成橫的了,段落很清楚,但中間有些字變成亂碼了
不過正確度達到90%左右

那如果照原來直書的格式呢?

選擇『保留格式』,就可以進行直書的掃描!


恩~字體都正確了,
如果報告是直書的時候就非常方便了~鼓掌

做報告免不了還有表格…掃進Word裡


表格線有些不太清楚,但建議如果掃表格不需更改內容的話,掃成整個圖檔就好
在綿妹的要求下,阿綿又在掃了一次,這次換成WordPad試試看


哇!這次就非常成功摟~連表格線都一清二楚


掃描雜誌裡的圖表,旁邊還有小字不知道掃不掃的到…
如果圖表和文字要一起掃呢? 阿綿只能說,綿妹還真是偷懶。無言


雖然圖的位置有一點跑掉,但是旁邊的小字都還在呢! 其實本來不寄望它可以一起掃的,效果還不錯 順帶一提,圖上的字都沒跑掉還可以編輯呢!純粹掃圖不知解析度如何? (這張雜誌稿純粹是阿綿的私心)



忘了選儲存路徑,結果跑到hp的軟體裡了,但發現它可以像投影片一樣的檢視掃描的圖片,也可以編輯,雖然電腦裡能處理這樣程度的程式比比皆是,既然是送的就不要太挑摟~介面還滿美的啦!! 我只能說解析度對棉妹來說常夠用啦!



只有一張就選擇標準的吧!快快印出來吧!!
印出來的效果還不錯呢!很樂

那如果大片底圖加文字呢?


非常好,底圖是底圖,字是字…而且字還能夠編輯 但有些字跑掉了

放大的掃描檔


附上原圖 天哪~這個本書的字會不會太小



阿綿一量原圖發現,下面的小字只有0.1~0.2公分左右呢!


沒想到還滿清楚的呢!目前為止都還算順利!


突然出現一本如字典一般厚的原文書 我的小白~不知吃不吃的下
疑~原來上蓋可以拿下來耶~好加在


上蓋是非常好用的工具之一


之前的書可以用上蓋壓的這麼平呢!!
掃的越平整當然辨識度也越高摟~
我的媽~怎麼還有報紙阿,不知掃起來會不會黑黑的…


折完才發現忘了把上蓋拿掉,折來折去超麻煩的啦!第一次掃的超醜~
順帶一提,掃的太醜是會變成亂碼的…
猴腮厲報紙也OK耶!而且一點也不會黑…
這張圖檔是因為選彩色加上保留格式,所以雖然看起來跟原來報紙一模一樣,但是裡面的字是可以被編輯的喔~

厚~掃了一堆…累死阿綿了
今天先到這裡吧!
留下還在努力整理資料的綿妹…阿綿要先去睡啦!
睡前要叫阿宅先來幫忙馬一下~呼~
分享至PLURK 噗浪 分享至FACEBOOK 臉書

沒有留言: