亞洲資本網(wǎng) > 資訊 > 科技頻道 > 正文
如何讓人工智能更智能 你需要一個開源平臺
2020-09-16 13:59:06來源: 科技行者

2020年6月19日,奧斯納布呂克州下薩克森:Melanie Ploppa老師在教室中為小學(xué)生們上課。由于新冠隔離法規(guī)的限制,目前各學(xué)校必須采取特殊的衛(wèi)生管理措施。另外,課堂中學(xué)生的數(shù)量也受到控制。

在COVID-19疫情全面爆發(fā)之后,眾多在校學(xué)生開始在家中參與網(wǎng)課,但事實證明這樣的隔空授課方式確實無法與常規(guī)課堂相媲美。人們還普遍意識到,現(xiàn)實中面對面交流問題、討論思路、明確團隊挑戰(zhàn)并以小組形式達成目標(biāo)的整個過程,確實可以帶來更好的學(xué)習(xí)效果。沒錯,不然的話我們要學(xué)校干什么?

但同樣的互連互用技術(shù),能否幫助計算機在構(gòu)建數(shù)據(jù)驅(qū)動型人工智能(AI)知識庫與軟件驅(qū)動型分析引擎時,也達成更好的“學(xué)習(xí)”效果?

機器學(xué)習(xí)中的開放性最近,業(yè)界涌現(xiàn)了不少開放式AI用例。比如,今年6月,Databricks就憑借其開源機器學(xué)習(xí)成果正式加入Linux基金會。Databricks方面將項目命名為MLflow,旨在體現(xiàn)其以端到端流程的形式提供機器學(xué)習(xí)功能的基本定位,并希望該項目能夠貫穿整個開發(fā)生命周期。

在機器學(xué)習(xí)領(lǐng)域,端到端是一種相當(dāng)流行的表達方式,主要強調(diào)軟件工具從開發(fā)生命周期的一端持續(xù)作用至另一端的全面涵蓋能力。

而如果從術(shù)語的角度出發(fā),端到端則對整個數(shù)據(jù)流程做出了如下要求:準(zhǔn)備(包括解析數(shù)據(jù)以及重復(fù)數(shù)據(jù)刪除)、實驗階段、將代碼打包為“可重復(fù)運行”形式(可在操作系統(tǒng)中以智能模塊的形式進行自由組合,并實現(xiàn)對應(yīng)功能的即插即用)、最后進入可靈活共享與協(xié)作的AI模型。

其中最重要的是“協(xié)作”部分,即通過開放(也是實質(zhì)意義上的開源)平臺、渠道社區(qū)實現(xiàn)AI與ML數(shù)據(jù)集、處理引擎乃至其他深度學(xué)習(xí)工具的共享能力。業(yè)界目前普遍相信,這才是生產(chǎn)力更高、且更加自然的機器學(xué)習(xí)實現(xiàn)方式。

Databricks的MLflow項目已經(jīng)擁有兩年發(fā)展歷史,期間有200多位貢獻者參與其中。而將其交由Linux基金會打理將保證項目本身形成一條獨立于任何特定廠商之外的發(fā)展路線,同時選擇一套開放的治理模型以擴大成果采用與社群貢獻。

Databricks方面解釋道,他們當(dāng)年創(chuàng)建MLflow的初衷在于解決機器學(xué)習(xí)模型開發(fā)流程中“固有的復(fù)雜性因素”。相信有從業(yè)經(jīng)歷的朋友都能感受到,這樣一個涉及機器模型構(gòu)建、訓(xùn)練、調(diào)優(yōu)、部署與管理的流程確實相當(dāng)令人頭痛。

Linux基金會戰(zhàn)略計劃副總裁Michael Dolan表示:“社區(qū)參與度的穩(wěn)定增長表明,數(shù)據(jù)團隊必須致力于構(gòu)建起未來的機器學(xué)習(xí)平臺。采用率的提升也意味著,我們必須采用開源方法以實現(xiàn)機器學(xué)習(xí)生命周期的標(biāo)準(zhǔn)化。我們與世界上多個頂尖開源項目保持著合作關(guān)系,相關(guān)經(jīng)驗也讓我們意識到,開放治理模型確實可以通過廣泛的行業(yè)貢獻與共識加快技術(shù)成果的創(chuàng)新與采用速度。”

推動數(shù)字智能的普及從某種程度上看,通過開源代碼開發(fā)還可以有力推動數(shù)字智能的普及。2020年6月,Abbyy發(fā)布了NeoML開源代碼庫,專門用于構(gòu)建、訓(xùn)練及部署機器學(xué)習(xí)模型。這家在硅谷、俄羅斯、歐洲以及遠東地區(qū)皆有業(yè)務(wù)體系的廠商向來專業(yè)文檔捕捉與管理業(yè)務(wù),但在最近的經(jīng)營范圍擴展之后,他們開始為企業(yè)客戶提供數(shù)字智能技術(shù)方案。

NeoML的源代碼已經(jīng)可以通過GitHub輕松獲取,其同時支持深度學(xué)習(xí)與傳統(tǒng)機器學(xué)習(xí)算法。作為一套跨平臺框架,它能夠針對云環(huán)境、臺式機以及移動設(shè)備之上運行的各類應(yīng)用程序?qū)崿F(xiàn)智能優(yōu)化。

之前提到的Databricks開放式智能技術(shù)主要用于大數(shù)據(jù)處理與云計算“集群”管理,而Abbyy的機器學(xué)習(xí)模型則專門針對圖像處理任務(wù)進行優(yōu)化,旨在為運行在任意設(shè)備上的預(yù)訓(xùn)練模型提供更出色的推理性能。兩個項目分別針對不同的技術(shù)用例,也各自擁有不同的智能化水平,但其核心訴求都在于充分發(fā)揮并回饋開放社區(qū)中的貢獻者力量。

Abbyy公司表示,隨著他們將開源視為核心任務(wù)軟件開發(fā)層面的主要方向,95%的IT管理者都開始重視這一波戰(zhàn)略性趨勢。Abbyy方面也將通過開源推動其機器學(xué)習(xí)框架快速發(fā)展,進而支持AI的不斷完善。如今,軟件開發(fā)者們可以直接使用NeoML構(gòu)建、訓(xùn)練并部署各類模型,借此實現(xiàn)對象識別、分類、語義細(xì)分、驗證以及預(yù)測等針對不同業(yè)務(wù)目標(biāo)的模型方案。

Abbyy公司AI布道師Ivan Yamshchikov還公布了更多具體用例,銀行可以使用這項技術(shù)開發(fā)出管理信貸風(fēng)險與預(yù)測客戶流失的模型;電信企業(yè)可以借此分析營銷活動的具體效果;零售與快速消費品(FMCG)企業(yè)則可建立起包含人臉識別與數(shù)據(jù)驗證功能的遠程客戶標(biāo)記方案。

Yamshchikov指出,“通過將我們的框架共享給整個開源領(lǐng)域,開發(fā)者們能夠借此實現(xiàn)推理提速、跨平臺功能并充分發(fā)揮移動設(shè)備的計算潛力,而他們的反饋與貢獻又將不斷完善并改進我們的這套代碼庫。我們樂于看到AI技術(shù)的整體進步,也將努力讓機器學(xué)習(xí)走進更多更具價值、影響力更強的用例。”

敞開你的“心扉”但是,開源真是實現(xiàn)最佳AI智能的唯一途徑嗎?技術(shù)領(lǐng)域不能搞粗暴的民粹,封閉的專有圈子同樣是機器學(xué)習(xí)技術(shù)領(lǐng)域重要且產(chǎn)出豐厚的一片疆土。只有不斷擴展學(xué)習(xí)交流范圍,甚至直接分享具體學(xué)習(xí)模型,才有可能真正實現(xiàn)AI技術(shù)的大眾化進程。

以Abbyy打造的NeoML項目為例,這項技術(shù)支持開放神經(jīng)網(wǎng)絡(luò)交換(ONNX),這是一套具備可互操作性的機器學(xué)習(xí)模型全球開放生態(tài)系統(tǒng)。項目主旨在于改善各類工具間的兼容性,保證軟件開發(fā)人員能夠輕松使用正確的工具組合實現(xiàn)預(yù)期功能。微軟、Facebook等多家合作伙伴已經(jīng)加入到ONNX開源標(biāo)準(zhǔn)中來,相信未來開放式AI智能將變得愈發(fā)普遍。

這可能就是人們常說的“敞開心扉”吧。

關(guān)鍵詞: 人工智能 開源平臺

專題新聞
  • 雖說萬物皆可盤 但盤得住時光的才是王牌
  • 霍爾果斯:馮小剛等明星資本大撤離
  • 開心麻花電影頻出
  • 男頻IP為何“武不動乾坤,斗不破蒼穹”
  • 《鐵血戰(zhàn)士》北美市場票房跳水 又玩壞一個大IP?

京ICP備2021034106號-51

Copyright © 2011-2020  資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com