免責聲明:葛興個人博客的文章均為博主葛興原創/轉載。如有侵權,概不負責。葛興保留一切權力!
當前位置:中国云南福彩快乐十分 > 搜索引擎 > 正文

谷歌搜索和百度智能對比,谷歌有點可怕

08-21 搜索引擎

中国云南福彩快乐十分 www.awrlc.com

 
 
       谷歌搜索和百度智能對比,谷歌有點可怕
 
       近日,各家媒體紛紛報道,谷歌回到中國了,對此,李彥宏表示對百度的技術非常有信心,并自認為在中國,憑借技術和創新方面可以打敗谷歌,并不擔心谷歌入華。結果,轉天就被一些不甘寂寞的小伙伴打臉。。。

 
谷歌搜索和百度智能對比,谷歌有點可怕
 
       在HUPU步行街上面看到有網友做的百度和谷歌圖片搜索的對比很有趣,自己也親自試一下,百度上搜索“ 滑嫩”、“ 鮮嫩” 等全是美女圖片(哇~!被百度暴露了…捂臉…),而谷歌上搜索這些內容,出現的則是一些美食等。emmm。。。

       被爆料后,百度程序猿們加班加點,總算是把大家揪出來的敏感詞匯處理了。

       可是,今天發生的一件事,讓我意識到,不僅僅是搜索算法,谷歌在另外一個方面早就超過了百度。。。

       今天用百度搜索了一個QQ 號,圖片搜索空空如也,什么結果也沒有。

 
谷歌搜索和百度智能對比,谷歌有點可怕
 
       不死心的我又用Google搜索了一下,結果。。。

 
谷歌搜索和百度智能對比,谷歌有點可怕
 
       你可能會問,Google搜索出來的是些什么東西,完全看不懂啊~!我來告訴大家,我搜索的這個QQ是同事在office上注冊用的用戶名,哇!有些東西雖然年代久遠,但是不難看出,應該是與他相關聯的!

       也就是說,Google 現在已經開始對互聯網上的圖片文本做了識別提取,并建立索引!

       在我們的印象中,搜索引擎一般會基于圖片旁邊的文字描述給圖片打標簽,或者利用神經網絡識別圖片上的物體,并不會掃描讀取圖片上的文本內容。

 
用神經網絡給圖片分類
       
       所以很多時候你搜索圖片上的文本,搜索引擎不會給你返回正確結果。

       不知道什么時候,谷歌已經偷偷給自己的搜索引擎升了個級!?

       小哥又借用了一個小伙伴的身份證前幾位,分別在百度和谷歌上搜索“ 3709831986 ”,百度依然什么也搜不出來,而谷歌返回了一堆結果。

       這些圖片上大部分都有3709831986這幾個數字,有一些保險單的內容,有營業執照,火車票。。。只要與這串數字有關的信息都給你展示出來了。。。佩服。。。

 
谷歌搜索和百度智能對比,谷歌有點可怕
 
       大家也可以試試自己的身份信息能不能被搜到

       給,這是哥三十年的膝蓋,請收下。。。

       不過讓我好奇的是,谷歌搜索引擎是什么時候開始識別圖片文本的?

       谷歌沒有給出過官方消息,相關的討論也寥寥無幾,2016 年的時候谷歌的大佬還否認過谷歌在識別圖片文本。

       不過在去年7 月的時候,有一個博客主已經發現,所以至少去年谷歌就已經偷偷升了級~

 
谷歌搜索和百度智能對比,谷歌有點可怕
 
       其實,谷歌很早就積累了圖片的文本識別相關技術—— OCR ( 光學字符識別)。

       這個技術本身并不難,最早谷歌將OCR 應用在書籍掃描轉換文本上,這樣只要你搜索書中的一句話,它就能推給你正確的書籍。

       現在這個技術應用也越來越廣泛,許多手機APP都可以支持。

 
谷歌搜索和百度智能對比,谷歌有點可怕
 
       現在,谷歌已經將這項技術應用在互聯網的所有圖片上。

       之所以感到驚訝,是因為我們每天要產生大量圖片,光在Facebook 和Instagram 上每天就產生近4 億張圖片,微博上每天產生1.5 億張圖片,保守估計互聯網上每天要多出8 億圖片。

       而谷歌對每張圖片都進行OCR 算法處理,獲取里面的文本信息,這是一項海量的工程,消耗太大了。但谷歌還是做到了,不得不感嘆谷歌的強大。

       正因如此,大大提高了我們使用搜索引擎的效率,更容易找到自己想要的結果~

       不過在以前,正是因為我們默認搜索不出圖片上的文本,才會放心的把一些資料保存成圖片放到網上。

       現在隨著這項技術的成熟,恐怕圖片也不再保險。。。誰能想到一個身份證號,就把身份證圖片都搜出來了呢?

       如何兼顧技術和隱私,恐怕未來需要谷歌好好處理一下~

       ————————我是分割線———————

       圖文來源:ZAKER新聞(部分、侵刪)

       參考資料:

       1.《用谷歌和百度同時搜索“鮮嫩、滑嫩、胸膜”等詞后…李彥宏贏了》,北美留學生日報

       2.《 Google: No, We Don't Understand Text In Images 》,Barry Schwartz

       3.《 How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read 》,Bernard Marr

       4.《Does Google Read Text in Images? NEW Evidence Says Yes!》,Steve Toth

       5.《互聯網上一天產生的流量,到底有多少?》,財經頭條

       iiiiiiiiii

       “ 嚇得我趕緊把網盤里的圖片都刪了。。 ”

 

?