摘要:在手機(jī)上通過攝像頭識別外界事物,這樣的體驗(yàn)像極了我們?nèi)说难劬Α?/p>
從 PC 時(shí)代到智能手機(jī)時(shí)代,搜索一直是人們?nèi)粘I钪凶畛R姷男枨笾?。根?jù) CNNIC 的報(bào)告,截至 2019 年 6 月,我國搜索引擎用戶規(guī)模有 6.95 億,其中手機(jī)搜索更是達(dá)到了 6.62 億,占比 95% 以上。
智能手機(jī)的普及和人工智能技術(shù)的發(fā)展,讓手機(jī)攝像頭有機(jī)會實(shí)時(shí)識別外界事物。相應(yīng)地,用戶的搜索需求也越發(fā)多樣,搜商品、搜花草、搜英文,恨不得搜萬物。與傳統(tǒng)搜圖需要拍照、上傳、識別等一系列繁雜步驟相比,百度識圖前段時(shí)間展示的新技術(shù),則使搜索突破了「框」的限制,「動態(tài)多目標(biāo)識別」與多樣搜索場景的實(shí)現(xiàn)等將手機(jī)識圖能力進(jìn)一步提升。輕松「識萬物」成為了對用戶而言,真正切實(shí)可行的體驗(yàn)。
用手機(jī)攝像頭「識萬物」,搜索品類更豐富
互聯(lián)網(wǎng)上的內(nèi)容與資源非常豐富,只要用戶善于利用搜索引擎,便幾乎可以找到任何想要的信息。在百度 App,當(dāng)用戶直接點(diǎn)擊搜索框右邊的相機(jī)圖標(biāo),對準(zhǔn)想要搜索的事物,不管是數(shù)學(xué)題、英文、條形碼,都能直接識別。
「識萬物」功能則更為神奇。用戶無需選擇識別對象的品類,直接拿起攝像頭即可識別大部分事物,例如鞋子、化妝品、雜志、食物等。這些在生活中毫不相關(guān)的東西,都可以用百度 App 的「識萬物」功能進(jìn)行識別。
目前,得益于人工智能技術(shù)的飛速發(fā)展,我們已經(jīng)可以通過手機(jī)攝像頭識別多樣事物。翻譯 App 可以直接識別看到的文字、購物 App 可以識別商品,也有專門針對花草樹木的識別軟件。但用戶的一大痛點(diǎn)在于,人們通常需要找到對應(yīng)的工具才能識別單獨(dú)品類的事物。
而百度作為一個(gè)綜合類的搜索引擎,當(dāng)然不會只把目標(biāo)放在單獨(dú)的幾個(gè)領(lǐng)域?!缸R萬物」正是這樣一個(gè)綜合類的識圖引擎,在手機(jī)上通過攝像頭識別外界事物,這樣的體驗(yàn)像極了我們?nèi)说难劬Α?/p>
動態(tài)多目標(biāo)識別:變革性交互引領(lǐng)行業(yè)
「動態(tài)多目標(biāo)識別」是百度識圖具備的一項(xiàng)獨(dú)特優(yōu)勢,它突破性地應(yīng)用了 Lens 技術(shù),也更便于實(shí)現(xiàn)產(chǎn)品與用戶間的創(chuàng)新型交互。
移動端實(shí)時(shí)感知和云端視覺搜索使得 Lens 技術(shù)具備一種類人眼的視覺 AI 能力。應(yīng)用這項(xiàng)技術(shù)后,打開百度識圖,無需拍照,毫秒內(nèi)便可自動掃描并鎖定鏡頭內(nèi)檢測到的全部物體,即刻反饋「它是什么」與「它背后的相關(guān)信息」,讓用戶最大化實(shí)現(xiàn)「所見即所得」的信息瀏覽體驗(yàn)。
由于省去了拍照、上傳等步驟,百度 App 的識圖體驗(yàn)變得十分順暢,用戶只要舉起手機(jī)對準(zhǔn)要識別的事物,它的信息就會即刻出現(xiàn)在手機(jī)屏幕上,點(diǎn)擊即可查看。
隨攝像頭的移動,百度 App 會在實(shí)時(shí)追蹤已識別的物品同時(shí),識別新進(jìn)入畫面的物品。用戶從而可以更快捷地利用百度識圖同時(shí)獲取多元信息。
用視覺認(rèn)知世界,一本移動的百科全書
百度識圖通過利用視覺識別能力,串聯(lián)起用戶旅行、購物、觀影等不同場景時(shí)產(chǎn)生的認(rèn)知訴求,它能識花、識商品,也能識別影視劇信息。
在精準(zhǔn)識別的基礎(chǔ)上,借助百度移動生態(tài)提供的信息和服務(wù),用戶還可進(jìn)行多平臺比價(jià)、直接下單購買等后續(xù)操作。由此,用戶想要的信息都自然聚合在一起,并且不需要事先選擇品類、領(lǐng)域,可以說是「一氣呵成」,而搜索體驗(yàn)也不再止步于單一的識別結(jié)果,獲取信息更為豐富。
以生活中常見的數(shù)碼產(chǎn)品為例,百度識圖可以識別出品牌、型號、價(jià)格等信息,還會給出購買鏈接,方便用戶直接下單購買。
另一個(gè)實(shí)用的使用場景則是識別各種化妝品、藥品上的包裝文字。很多藥妝來自國外,一長串外文,打字輸入頗為麻煩,使用識圖功能就簡單許多。識別出品牌和型號后,用戶可以直接通過 OCR 來復(fù)制包裝上的文字,方便進(jìn)一步編輯。在該場景下,用戶也可以選擇直接進(jìn)行文字翻譯,所有的有效信息,在一個(gè)頁面就能全部獲得,無需其余復(fù)雜操作。
當(dāng)然,用戶的娛樂化需求也能得到充分滿足。生活中經(jīng)常出現(xiàn)這樣的場景,看到人們在網(wǎng)上分享的書籍、漫畫、影視劇截圖,卻苦于不知其名。這時(shí)除了等待他人解答,用戶還可以選擇自己尋找答案,用百度 App 直接識圖。
對于一些熱門的影視劇、動漫,百度識圖還會顯示截圖所出現(xiàn)的具體集數(shù)。如果喜歡劇中的演員、角色,也能直接點(diǎn)擊查看,若有對應(yīng)視頻資源即可直接跳轉(zhuǎn)觀看。
此外,百度識圖目前已經(jīng)可以識別超過 1000 萬種物品,其中包含了 20000 多種植物以及上百萬種美妝產(chǎn)品。在此基礎(chǔ)上,百度識圖還支持超過 30 種場景的智能判斷,可以針對被識別物品的不同,提供相應(yīng)的擴(kuò)展信息和服務(wù)。
百度識圖的背后還有很多強(qiáng)大的技術(shù),而通過百度 App 的「識萬物」功能,用戶感受到的只是簡單與便捷,這就是技術(shù)的最終目的。
隨著 5G、AI 技術(shù)、手機(jī)相機(jī)的發(fā)展,智能產(chǎn)品在滿足用戶價(jià)值的同時(shí),也在不斷開拓、延伸用戶需求。未來,手機(jī)識圖還將釋放更多能量。如果我們把目光放更遠(yuǎn),將這些能力從手機(jī)轉(zhuǎn)移到可穿戴設(shè)備中,比如智能眼鏡,也許未來就真的會出現(xiàn)像科幻片中那樣的場景,眼睛一掃所有事物信息全部展現(xiàn)在眼前。
本文作者:劉丟丟
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。