中國(guó) AI 正在全球不斷提升影響力。
文 | 劉琳
自 2006 年深度學(xué)習(xí)算法被提出、2012 年開(kāi)始大數(shù)據(jù)爆發(fā)式增長(zhǎng)以來(lái),人工智能領(lǐng)域的各項(xiàng)技術(shù)分支也在不斷發(fā)展,人工智能相關(guān)的產(chǎn)業(yè)化落地方案和商業(yè)化模式逐漸清晰,人工智能的細(xì)分領(lǐng)域技術(shù)分支的代表性企業(yè)及其競(jìng)爭(zhēng)格局也逐漸形成。
近日,中國(guó)科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室發(fā)布了《 2019 年人工智能發(fā)展白皮書(shū)》, 對(duì)人工智能關(guān)鍵技術(shù)(計(jì)算機(jī)視覺(jué)技術(shù)、自然語(yǔ)言處理技術(shù)、跨媒體分析推理技術(shù)、智適應(yīng)學(xué)習(xí)技術(shù)、群體智能技術(shù)、自主無(wú)人系統(tǒng)技術(shù)、智能芯片技術(shù)、腦機(jī)接口技術(shù)等)、人工智能典型應(yīng)用產(chǎn)業(yè)與場(chǎng)景(安防、金融、零售、交通、教育、醫(yī)療、制造、健康等)做出了梳理。
并根據(jù)調(diào)研數(shù)據(jù)重點(diǎn)分析了人工智能各個(gè)細(xì)分領(lǐng)域的關(guān)鍵技術(shù)和產(chǎn)業(yè)應(yīng)用,并推出全球人工智能企業(yè) TOP20 榜單,微軟、谷歌、臉書(shū)、百度位列排行榜前列。
白皮書(shū)顯示,中國(guó) AI 正在全球不斷提升影響力,成為主導(dǎo) AI 創(chuàng)新落地的有力競(jìng)爭(zhēng)者。在人工智能向各行各業(yè)滲透的過(guò)程中,主要的人工智能技術(shù)還掌握在大型科技公司,而人工智能開(kāi)放創(chuàng)新平臺(tái)讓 AI 普惠到更多公司和用戶,對(duì)于推動(dòng)全行業(yè)的發(fā)展、加速人工智能社會(huì)的建設(shè)都具有重要推動(dòng)價(jià)值。
1、人工智能關(guān)鍵技術(shù)不斷取得突破
1、計(jì)算機(jī)視覺(jué)技術(shù)
計(jì)算機(jī)視覺(jué)(Computer Vision)是一門(mén)研究如何使機(jī)器“看”的科學(xué), 更進(jìn)一步地說(shuō),是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和 測(cè)量的科學(xué)。近幾年計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)了快速發(fā)展,其主要學(xué)術(shù)原因是 2015 年基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)算法在 ImageNet 數(shù)據(jù)庫(kù)上的識(shí)別準(zhǔn)確率首次超過(guò)人類(lèi),同年 Google 也開(kāi)源了自己的深度學(xué)習(xí)算法。計(jì)算機(jī)視覺(jué)系統(tǒng)的主要功能有圖像獲取、預(yù)處理、特征提取、檢測(cè)/分割和高級(jí)處理。
2、自然語(yǔ)言處理技術(shù)
自然語(yǔ)言處理(Natural Language Processing)是一門(mén)通過(guò)建立形式化的計(jì)算模型來(lái)分析、理解和處理自然語(yǔ)言的學(xué)科,也是一門(mén)橫跨語(yǔ)言學(xué)、計(jì)算 機(jī)科學(xué)、數(shù)學(xué)等領(lǐng)域的交叉學(xué)科。自然語(yǔ)言處理,是指用計(jì)算機(jī)對(duì)自然語(yǔ)言的形、音、義等信息進(jìn)行處理,即對(duì)字、詞、句、篇章的輸入、輸出、識(shí)別、 分析、理解、生成等的操作和加工。自然語(yǔ)言處理的具體表現(xiàn)形式包括機(jī)器翻譯、文本摘要、文本分類(lèi)、文本校對(duì)、信息抽取、語(yǔ)音合成、語(yǔ)音識(shí)別等??梢哉f(shuō),自然語(yǔ)言處理就是要計(jì)算機(jī)理解自然語(yǔ)言,自然語(yǔ)言處理機(jī)制涉及 兩個(gè)流程,包括自然語(yǔ)言理解和自然語(yǔ)言生成,自然語(yǔ)言理解是讓計(jì)算機(jī)把輸入的語(yǔ)言變成有意思的符號(hào)和關(guān)系,然后根據(jù)目的再處理;自然語(yǔ)言生成則是把計(jì)算機(jī)數(shù)據(jù)轉(zhuǎn)化為自然語(yǔ)言。實(shí)現(xiàn)人機(jī)間的信息交流,是人工智能界、計(jì)算機(jī)科學(xué)和語(yǔ)言學(xué)界所共同關(guān)注的重要問(wèn)題。
? ? ? ?
? ? ? ?自然語(yǔ)言處理的研究可以分為基礎(chǔ)性研究和應(yīng)用性研究?jī)刹糠郑Z(yǔ)音和文本是兩類(lèi)研究的重點(diǎn)?;A(chǔ)性研究主要涉及語(yǔ)言學(xué)、數(shù)學(xué)、計(jì)算機(jī)學(xué)科等領(lǐng)域,相對(duì)應(yīng)的技術(shù)有消除歧義、語(yǔ)法形式化等。應(yīng)用性研究則主要集中在一些應(yīng)用自然語(yǔ)言處理的領(lǐng)域,例如信息檢索、文本分類(lèi)、機(jī)器翻譯等。由于我國(guó)基礎(chǔ)理論即 機(jī)器翻譯的研究起步較早,且基礎(chǔ)理論研究是任何應(yīng)用的理論基礎(chǔ),所以語(yǔ)法、句法、語(yǔ)義分析等基礎(chǔ)性研究歷來(lái)是研究的重點(diǎn),而且隨著互聯(lián)網(wǎng)網(wǎng)絡(luò)技術(shù)的 發(fā)展,智能檢索類(lèi)研究近年來(lái)也逐漸升溫。近年來(lái),計(jì)算機(jī)視覺(jué)在產(chǎn)業(yè)界和學(xué)術(shù)界不斷取得突破,取得代表性成果的組織有谷歌、阿里、百度、搜狗、科大訊 飛等公司,清華大學(xué)、Allen 人工智能研究所等高校/研究所以及其他多種類(lèi)型的組織或個(gè)人。
? ? ? ?
3、跨媒體分析推理技術(shù)
以往的媒體信息處理模型往往只針對(duì)某種單一形式的媒體數(shù)據(jù)進(jìn)行推理分析,比如圖像識(shí)別、語(yǔ)音識(shí)別、文本識(shí)別等,而越來(lái)越多的任務(wù)需要像人一樣能夠協(xié) 同綜合處理多種形式(文本、音頻、視頻、圖像等)的信息,這就是跨媒體分析與推理??缑襟w是一個(gè)比較廣義的概念,既表現(xiàn)為包括網(wǎng)絡(luò)文本、圖像、音頻、 視頻等復(fù)雜媒體對(duì)象混合并存,又表現(xiàn)為各類(lèi)媒體對(duì)象形成復(fù)雜的關(guān)聯(lián)關(guān)系和組織結(jié)構(gòu),還表現(xiàn)在具有不同模態(tài)的媒體對(duì)象跨越媒介或平臺(tái)高度交互融合。
通過(guò)“跨媒體”能從各自的側(cè)面表達(dá)相同的語(yǔ)義信息,能比單一的媒體對(duì)象及其特定的模態(tài)更加全面地反映特定的內(nèi)容信息。相同的內(nèi)容信息跨越各類(lèi)媒體對(duì)象交叉?zhèn)鞑ヅc整合,只有對(duì)這些多模態(tài)媒體進(jìn)行融合分析,才能盡可能全面、正確地理解這種跨媒體綜合體所蘊(yùn)涵的內(nèi)容信息??缑襟w分析推理技術(shù)主要包括跨媒體檢索、跨媒體推理、跨媒體存儲(chǔ)幾個(gè)研究范疇,可應(yīng)用于網(wǎng)絡(luò)內(nèi)容監(jiān)管、輿情分析、信息檢索、智慧醫(yī)療、自動(dòng)駕駛、智能穿戴設(shè)備等場(chǎng)景。
4、智適應(yīng)學(xué)習(xí)技術(shù)
作為教育領(lǐng)域最具突破性的技術(shù),智適應(yīng)學(xué)習(xí)技術(shù) ( Intelligent Adaptive? Learning) 模擬了老師對(duì)學(xué)生一對(duì)一教學(xué)的過(guò)程,賦予了學(xué)習(xí)系統(tǒng)個(gè)性化教學(xué)的能力和傳統(tǒng)千人一面的教學(xué)方式相比,智適應(yīng)學(xué)習(xí)系統(tǒng)帶給了學(xué)生個(gè)性化的學(xué)習(xí)體 驗(yàn),提升了學(xué)生的學(xué)習(xí)投入度和學(xué)習(xí)效率。采用了智適應(yīng)學(xué)習(xí)技術(shù)的學(xué)習(xí)系統(tǒng)能夠針對(duì)學(xué)生的具體學(xué)習(xí)情況提供個(gè)性化學(xué)習(xí)解決方案,包括定位學(xué)生的知識(shí)漏洞、 持續(xù)性地評(píng)估學(xué)生的學(xué)習(xí)能力水平和知識(shí)狀態(tài)、實(shí)時(shí)動(dòng)態(tài)提供個(gè)性化學(xué)習(xí)內(nèi)容。智適應(yīng)學(xué)習(xí)技術(shù)讓教育領(lǐng)域一直困擾的質(zhì) 量、成本、可獲取性三大矛盾因素變成了歷史。
智適應(yīng)學(xué)習(xí)技術(shù)體系包括知識(shí)狀態(tài)診斷、能力水平評(píng)測(cè)和學(xué)習(xí)內(nèi)容推薦等。知識(shí)狀態(tài)診斷技術(shù)是指通過(guò)少量試題,在較短時(shí)間精準(zhǔn)診斷出學(xué)生的知識(shí)漏洞,這一技術(shù)較常用的算法是知識(shí)空間理論。能力水平評(píng)測(cè)技術(shù)是指評(píng)測(cè)出學(xué)生的知識(shí)掌握情況,分析出學(xué)生得到提升的學(xué)習(xí)能力、學(xué)習(xí)思維和學(xué)習(xí)方法,這一技術(shù)較常用的算法是項(xiàng)目反應(yīng)理論、貝葉斯知識(shí)追蹤。學(xué)習(xí)內(nèi)容推薦技術(shù)是指依據(jù)學(xué)生學(xué)習(xí)情況,推薦合適的學(xué)習(xí)內(nèi)容,這一技術(shù)較常用的算法是機(jī)器學(xué)習(xí)算法,該算法以學(xué)生的所有信息為輸入,輸出是學(xué)生接下來(lái)需要學(xué)習(xí)的內(nèi)容,達(dá)到最大化學(xué)習(xí)效率的目的。
? ? ? ?目前在全球已有一億多學(xué)生在使用智適應(yīng)學(xué)習(xí)系統(tǒng),覆蓋了各個(gè)年齡段,從小學(xué)、初中、高中,到高等教育、職業(yè)教育和成人教育,已應(yīng)用到文、理、工、醫(yī)等不同學(xué)科領(lǐng)域。
5、 群體智能技術(shù)
群體智能(collective intelligence)也稱集體智能、群智。群體智能是一種共享的智能,是集結(jié)眾人的意見(jiàn)進(jìn)而轉(zhuǎn)化為決策的一種過(guò)程,用來(lái)對(duì)單一個(gè)體做出隨機(jī)性決策的風(fēng)險(xiǎn)。對(duì)群體智能的研究,實(shí)際上可以被認(rèn)為是一個(gè)屬于社會(huì)學(xué)、商業(yè)、計(jì)算機(jī)科學(xué)、大眾傳媒和大眾行為的分支學(xué)科,研究從夸克層次到細(xì)菌、植物、動(dòng)物以及人類(lèi)社會(huì)層次的群體行為的一個(gè)領(lǐng)域。
群體智能最早源于對(duì)以螞蟻、蜜蜂等為代表的社會(huì)性昆蟲(chóng)的群體行為的研究,自1991年意大利學(xué)者Dorigo提出蟻群優(yōu)化(Ant Colony Optimization, ACO)理論開(kāi)始,群體智能作為一個(gè)理論被正式提出,并逐漸吸引了大批學(xué)者的關(guān)注,從而掀起了研究高潮。1995年,Kennedy 等學(xué)者提出粒子群優(yōu)化算法(Particle Swarm Optimization, PSO),此后群體智能研究迅速展開(kāi)。目前群體智能的研究主要包括智能蟻群算法和粒子群算法,智能蟻群算法主要包括蟻群優(yōu)化算法、蟻群聚類(lèi)算法和多機(jī)器人協(xié)同合作系統(tǒng)。其中,蟻群優(yōu)化算法和粒子群優(yōu)化算法在求解實(shí)際問(wèn)題時(shí)應(yīng)用最為廣泛。
6、 自主無(wú)人系統(tǒng)技術(shù)
自主無(wú)人系統(tǒng)是能夠通過(guò)先進(jìn)的技術(shù)進(jìn)行操作或管理而不需要人工干預(yù)的系統(tǒng),是由機(jī)械、控制、計(jì)算機(jī)、通信、材料等多種技術(shù)融合而成的復(fù)雜系統(tǒng)。自主無(wú)人系統(tǒng)可應(yīng)用到無(wú)人駕駛車(chē)輛、無(wú)人機(jī)、服務(wù)型機(jī)器人、空間機(jī)器人、海洋機(jī)器人、無(wú)人車(chē)間、智能工廠等場(chǎng)景中,并實(shí)現(xiàn)降本增效的作用。
7、 智能芯片技術(shù)
近年來(lái)我國(guó)學(xué)術(shù)界和產(chǎn)業(yè)界都加大了對(duì)芯片技術(shù)的研發(fā)力度,國(guó)內(nèi)智能計(jì)算芯片技術(shù)不斷取得新的成果。一些基于傳統(tǒng)計(jì)算架構(gòu)的芯片和各種軟硬件加速方案相結(jié)合,在一些人工智能應(yīng)用場(chǎng)景下都取得了巨大成功,但由于市場(chǎng)需求的多樣性,很難有任何單一的設(shè)計(jì)和方法能夠很好地適用于各類(lèi)情況。因此,學(xué)術(shù)界和產(chǎn)業(yè)界涌現(xiàn)出多種專門(mén)針對(duì)人工智能應(yīng)用的新穎設(shè)計(jì)和方法,覆蓋了從半導(dǎo)體材料、器件、電路到體系結(jié)構(gòu)的各個(gè)層次。
? ? ??
8、 腦機(jī)接口技術(shù)
腦機(jī)接口(Brain-Computer Interface,BCI)是在人或動(dòng)物腦(或者腦細(xì)胞的培養(yǎng)物)與外部設(shè)備間建立的直接連接通路。通過(guò)單向腦機(jī)接口技術(shù),計(jì)算機(jī)可以接受腦傳來(lái)的命令,或者發(fā)送信號(hào)到腦,但不能同時(shí)發(fā)送和接收信號(hào)。而雙向腦機(jī)接口允許腦和外部設(shè)備間的雙向信息交換。2013年,自美國(guó)首次宣布啟動(dòng)“腦計(jì)劃”以來(lái),歐洲、日本、韓國(guó)等陸續(xù)參與“腦科技”競(jìng)賽項(xiàng)目,據(jù)已公開(kāi)數(shù)據(jù)表明,全球在腦機(jī)接口相關(guān)領(lǐng)域的研發(fā)支持已經(jīng)超過(guò)200億美元。
2、人工智能賦能產(chǎn)業(yè)與應(yīng)用場(chǎng)景
在人工智能技術(shù)向各行各業(yè)滲透的過(guò)程中,不同產(chǎn)品由于使用場(chǎng)景復(fù)雜度的不同、技術(shù)發(fā)展水平的不同,而導(dǎo)致其成熟度也不同。比如,教育和音響行業(yè)的核心環(huán)節(jié)已有成熟產(chǎn)品,技術(shù)成熟度和用戶心理接受度都較高;個(gè)人助理和醫(yī)療行業(yè)在核心環(huán)節(jié)已出現(xiàn)試驗(yàn)性的初步成熟產(chǎn)品,但由于場(chǎng)景復(fù)雜,涉及個(gè)人隱私和生命健康問(wèn)題,當(dāng)前用戶心理接受度較低;自動(dòng)駕駛和咨詢行業(yè)在核心環(huán)節(jié)則尚未出現(xiàn)成熟產(chǎn)品,無(wú)論是技術(shù)方面還是用戶心理接受度方面都還沒(méi)有達(dá)到足夠成熟的程度。
在人工智能技術(shù)向各行各業(yè)滲透的過(guò)程中,安防和金融行業(yè)的人工智能使用率最高,零售、交通、教育、醫(yī)療、制造、健康行業(yè)次之。安防行業(yè)一直圍繞著視頻監(jiān)控在不斷改革升級(jí),在政府的大力支持下,我國(guó)已建成集數(shù)據(jù)傳輸和控制與一體的自動(dòng)化監(jiān)控平臺(tái),隨著計(jì)算機(jī)視覺(jué)技術(shù)出現(xiàn)突破,安防行業(yè)便迅速向智能化前進(jìn)。金融行業(yè)擁有良好的數(shù)據(jù)積累,在自動(dòng)化的工作流與相關(guān)技術(shù)的運(yùn)用上有不錯(cuò)的成效,組織機(jī)構(gòu)的戰(zhàn)略與文化也較為先進(jìn),因此人工智能技術(shù)也得到了良好的應(yīng)用。
零售行業(yè)在數(shù)據(jù)積累、人工智能應(yīng)用基礎(chǔ)、組織結(jié)構(gòu)方面均有一定基礎(chǔ)。交通行業(yè)則在組織基礎(chǔ)與人工智能應(yīng)用基礎(chǔ)上優(yōu)勢(shì)明顯,并已經(jīng)開(kāi)始布局自動(dòng)駕駛技術(shù)。教育行業(yè)的數(shù)據(jù)積累雖然薄弱,但行業(yè)整體對(duì)人工智能持重點(diǎn)關(guān)注的態(tài)度,同時(shí)也開(kāi)始在實(shí)際業(yè)務(wù)中結(jié)合人工智能技術(shù),因此未來(lái)發(fā)展可期。醫(yī)療與健康行業(yè)擁有多年的醫(yī)療數(shù)據(jù)積累與流程化的數(shù)據(jù)使用過(guò)程,因此在數(shù)據(jù)與技術(shù)基礎(chǔ)上有著很強(qiáng)的優(yōu)勢(shì)。制造行業(yè)雖然在組織機(jī)構(gòu)上的基礎(chǔ)相對(duì)薄弱,但擁有大量高質(zhì)量的數(shù)據(jù)積累以及自動(dòng)化的工作流,為人工智能技術(shù)的介入提供了良好的技術(shù)鋪墊。
安防:安保、警務(wù)、治安、人車(chē)流監(jiān)控等場(chǎng)景全面應(yīng)用 。
金融:以智能風(fēng)控為主,同時(shí)滲透支付、理賠、投研投顧等場(chǎng)景 。
? ? ? ?
零售:人工智能提升零售全流程運(yùn)行效率,優(yōu)化消費(fèi)者體驗(yàn) 。
? ? ?
交通:人工智能應(yīng)用到擁堵分析、路線優(yōu)化、車(chē)輛調(diào)度、駕駛輔助等場(chǎng)景,有效改善交通問(wèn)題 。
教育:由表及里,人工智能技術(shù)逐漸深入學(xué)習(xí)環(huán)節(jié)。
醫(yī)療:從影像分析、輔助診療、健康管理等角度做好醫(yī)患助手。
制造:助力生產(chǎn)制造優(yōu)化,減少重復(fù)勞動(dòng),實(shí)現(xiàn)智能制造。
健康:降低健康管理成本,實(shí)現(xiàn)交互革命,增強(qiáng)人類(lèi)功能。
3、人工智能開(kāi)放創(chuàng)新平臺(tái)逐步建立
雖然人工智能技術(shù)不斷向眾多行業(yè)和商業(yè)場(chǎng)景滲透,但目前人工智能的能力仍然不是像云計(jì)算一樣可以隨取隨用的通用資源,主要的人工智能技術(shù)還掌握在大型科技公司和互聯(lián)網(wǎng)巨頭的手里,若能讓人工智能普惠到更多公司和用戶,人工智能社會(huì)的建設(shè)才會(huì)明顯提速。在政府和大型公司的領(lǐng)跑下,越來(lái)越多的人工智能開(kāi)放平臺(tái)開(kāi)始涌現(xiàn)出來(lái)。
2017-2018年,科技部等多部門(mén)經(jīng)充分調(diào)研和論證,確定了五大國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái):分別依托百度、阿里云、騰訊、科大訊飛公司、商湯集團(tuán),建設(shè)自動(dòng)駕駛、城市大腦、醫(yī)療影像、智能語(yǔ)音、智能視覺(jué)人工智能開(kāi)放創(chuàng)新平臺(tái),并由科技部、發(fā)改委、財(cái)政部、教育部、工信部、中科院等15個(gè)部門(mén)構(gòu)成的新一代人工智能發(fā)展規(guī)劃推進(jìn)辦公室來(lái)推進(jìn)項(xiàng)目、基地、人才的統(tǒng)籌布局。
來(lái)源:中國(guó)科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室《2019 年人工智能發(fā)展白皮書(shū)》、雷鋒網(wǎng)