機(jī)器視覺影響我們發(fā)展人工智能的五種方式
時間:2024.10.08來源:深淺優(yōu)視點(diǎn)擊次數(shù):212次
1.智能小助手在視覺上開戰(zhàn) 隨著我們的系統(tǒng)越來越接近于“人性化”——就像人工智能,它將更需要視覺數(shù)據(jù)來進(jìn)行學(xué)習(xí)和處理其他數(shù)據(jù)。在LDV 峰會上,Evan Nisselson說到:“這是所有主要公司都想在激烈的競爭中擁有我們的活動視覺數(shù)據(jù)的原因之一?!薄盀榱俗龅竭@一點(diǎn),他們需要擁有攝像機(jī)?!崩?,亞馬遜最近為其以Alexa作為語音助手的智能設(shè)備—— Echo,添加了一臺攝像頭,而Google和Facebook最近又發(fā)布了新的增強(qiáng)現(xiàn)實(shí)研究的聲明。
2.光學(xué)器件足以引導(dǎo)無人駕駛車 我們經(jīng)常會看到類似于這樣的爭論——無人駕駛汽車是否需要LiDAR,或者說是僅依賴于光學(xué)的解決方案就已經(jīng)足夠。例如,特斯拉首席執(zhí)行官Elon Musk認(rèn)為,體積龐大且昂貴的設(shè)備LiDAR通過使用激光器實(shí)時地對其環(huán)境進(jìn)行映射不是駕駛時所必需的。 Wheras Humatics 的首席技術(shù)官Gregory Charvat在發(fā)布會上表示,汽車“不僅僅需要光學(xué)傳感器平臺[相機(jī)],他們也需要比差分GPS更精確的LiDAR,雷達(dá)和高精度無線電導(dǎo)航?!?br style="box-sizing: border-box; color: rgb(153, 153, 153); font-family: SourceHanSansCN-Normal, 微軟雅黑; font-size: 20px; text-wrap: wrap; background-color: rgb(255, 255, 255);"/> LiDAR和雷達(dá)通過范圍和角度來精確定位周圍環(huán)境中的實(shí)際物體,而基于用相機(jī)解決問題的深度學(xué)習(xí)則需要通過算法運(yùn)行圖像,并且即便這樣,最終仍只能取得一個預(yù)測的結(jié)果。然而,光學(xué)解決方案能在實(shí)際生活中識別某個地方效果更好,就像一個行人和一串像圣誕樹的像素點(diǎn)相比,在Auto X 的創(chuàng)始人兼CEO Jianxiong Xiao的令人印象深刻的演示中,他們的公司可以只使用相機(jī)來低成本的解決無人駕駛汽車的問題。
由于技術(shù)上的優(yōu)缺點(diǎn),汽車公司通常提前五年來進(jìn)行戰(zhàn)略研究,所以現(xiàn)在需要購買一些必備的硬件來確定2021年的最后生產(chǎn)時限。目前,LiDAR和一些更先進(jìn)的雷達(dá)依然很昂貴(對于前者來說即便80,000美元也被認(rèn)為是便宜的)、笨重。同時,如果要以一種混合的方式運(yùn)行所有這些光學(xué)技術(shù)和傳感器技術(shù),需要一臺足夠小的能適應(yīng)汽車的超級計(jì)算機(jī)。
3.視覺系統(tǒng)能讓機(jī)器比通過機(jī)器學(xué)習(xí)學(xué)得更好 LDV中的幾個演示提醒了我們,機(jī)器不僅僅通過神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)來學(xué)習(xí)。他們還有其他方法來學(xué)會識別和分析他們周圍的世界。Google研究的科學(xué)家Tali Dekel展示了一種技術(shù),使用計(jì)算機(jī)視覺來進(jìn)行識別,通過將屋頂上的直線或紫色水果中所存在的偏差放大,然后來判斷。例如,確定舊房子的結(jié)構(gòu)是否存在問題,或者是某個西紅柿是否比其他的成熟的更好,更飽滿??此坪芎唵?,但這是計(jì)算機(jī)視覺優(yōu)于人類的地方。
4.機(jī)器視覺可以幫助醫(yī)療診斷 病理學(xué)家平均每天有500張幻燈片要處理,而每張幻燈片又包含數(shù)十萬個需要分析的單個細(xì)胞,如果有癌癥的存在,那么醫(yī)生很容易將其遺漏?!皩τ谌祟悂碚f,我們無法像計(jì)算機(jī)一樣高效的工作,只因?yàn)槲覀儫o法去仔細(xì)觀察每一個單元格”,PathAI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Andrew Beck表示,“但我們認(rèn)為電腦每次都能做出完美的診斷?!?br style="box-sizing: border-box; color: rgb(153, 153, 153); font-family: SourceHanSansCN-Normal, 微軟雅黑; font-size: 20px; text-wrap: wrap; background-color: rgb(255, 255, 255);"/> 根據(jù)美國醫(yī)學(xué)協(xié)會的一項(xiàng)研究,對于一項(xiàng)正確的診斷,通常只有不到一半的病理學(xué)家會表示贊同。引用另一項(xiàng)重點(diǎn)研究乳腺癌淋巴結(jié)活檢的例子,Beck說明了計(jì)算機(jī)與人類病理學(xué)家所關(guān)注的側(cè)重點(diǎn)之間的區(qū)別;前者強(qiáng)調(diào)了許多會成為癌細(xì)胞容器的區(qū)域。Beck說:“我們?yōu)椴±韺W(xué)家提供原始圖像,然后他們?nèi)匀豢梢匀ゲ榭此麄兯煜さ臄?shù)據(jù),和那些由學(xué)習(xí)系統(tǒng)處理了的圖像,基本上這就可以確定癌癥的區(qū)域,然后醫(yī)生就能通過專門研究這些區(qū)域作出診斷?!比橄侔┭芯勘砻?,如果沒有人工智能,這種活檢只有85%的準(zhǔn)確率。而如果使用人工智能作為輔助,錯誤率將下降到只有5%。
5.計(jì)算機(jī)視覺領(lǐng)域的門檻變得越來越低 優(yōu)質(zhì)相機(jī),傳感器和深度學(xué)習(xí)軟件庫(如Google TensorFlow)的商品化大大擴(kuò)展了計(jì)算機(jī)視覺的使用范圍,我們看到許多新的初創(chuàng)公司出現(xiàn)。在Vision Summit舉辦的兩次比賽中,不論是一種能夠從Google對街景視圖圖像進(jìn)行判斷,然后生成人口學(xué)分析的技術(shù),還是一個能夠?qū)κ鹿拾l(fā)生后汽車的損壞程度進(jìn)行評估并且計(jì)算出維修成本的應(yīng)用程序,我們可以看到這些判斷和分析都僅僅是來源于一張圖片。