精品乱码一区内射人妻无码-亚洲中文AⅤ中文字幕在线-免费不卡国产福利在线观看-国产综合无码一区二区色蜜蜜

          正在閱讀:人工智能發(fā)展一大瓶頸:缺乏高質(zhì)量數(shù)據(jù)集

          人工智能發(fā)展一大瓶頸:缺乏高質(zhì)量數(shù)據(jù)集

          2016-07-07 10:35:57來源:數(shù)據(jù)分析網(wǎng) 原標(biāo)題:制約人工智能領(lǐng)域的并非算法不夠先進,而是缺乏高質(zhì)量數(shù)據(jù)集 關(guān)鍵詞:人工智能大數(shù)據(jù)機器人閱讀量:32529

          導(dǎo)讀:制約人工智能(AI)領(lǐng)域很多重大突破的,并非算法不夠先進,而是缺乏高質(zhì)量數(shù)據(jù)集。擁有針對特定領(lǐng)域的龐大數(shù)據(jù)集,能夠成為競爭優(yōu)勢的一個重要來源。
            【中國智能制造網(wǎng) 名家論壇】用于機器學(xué)習(xí)用途的數(shù)據(jù),其“不合理的有效性”引發(fā)了多年的廣泛爭論。也有觀點認(rèn)為,制約人工智能(AI)領(lǐng)域很多重大突破的,并非算法不夠先進,而是缺乏高質(zhì)量數(shù)據(jù)集。想要開發(fā)出先進的機器學(xué)習(xí)技術(shù),數(shù)據(jù)至關(guān)重要,這是貫穿那些討論的共同主題。
            
            人工智能發(fā)展一大瓶頸:缺乏高質(zhì)量數(shù)據(jù)集
            
            對于在業(yè)務(wù)中將機器學(xué)習(xí)作為核心技術(shù)的初創(chuàng)公司來說,能否獲得高質(zhì)量的訓(xùn)練數(shù)據(jù)極為關(guān)鍵。雖然很多算法和軟件工具都是開源和共享的,但好的數(shù)據(jù)集通常是專有的,且很難創(chuàng)建。因此,擁有針對特定領(lǐng)域的龐大數(shù)據(jù)集,能夠成為競爭優(yōu)勢的一個重要來源,尤其是在初創(chuàng)公司能夠快速引發(fā)數(shù)據(jù)網(wǎng)絡(luò)效應(yīng)的情況下(更多的用戶→更多的數(shù)據(jù)→更智能的算法→更好的產(chǎn)品→更多的用戶)。
            
            所以,如何創(chuàng)建高質(zhì)量數(shù)據(jù)集以用于訓(xùn)練學(xué)習(xí)算法,這是機器學(xué)習(xí)初創(chuàng)公司必須作出的一個重要的戰(zhàn)略決定。不幸的是,在剛開始的時候,初創(chuàng)公司的標(biāo)記數(shù)據(jù)常常十分有限,甚至缺失,為他們在數(shù)據(jù)驅(qū)動型產(chǎn)品的打造上取得重大進展增添了阻礙。因此,在聘請數(shù)據(jù)科學(xué)團隊或者部署昂貴的核心設(shè)施之前,有必要從一開始就研究制定好數(shù)據(jù)采集的策略。
            
            很多方法都可以幫助初創(chuàng)公司克服數(shù)據(jù)采集的冷啟動問題。數(shù)據(jù)策略/來源的選擇通常與商業(yè)模式的選擇、公司的關(guān)注點(消費者或企業(yè),水平或垂直,等等)以及融資的情況息息相關(guān)。以下是五種數(shù)據(jù)采集策略,雖然并不詳盡,且多少互有重疊,但能讓你對很多可用的方法有一個直觀的感受。
            
            策略一:人工作業(yè)
            
            從零開始創(chuàng)建好的專有數(shù)據(jù)集,幾乎永遠(yuǎn)意味著預(yù)先投入大量人力采集數(shù)據(jù),執(zhí)行難以規(guī)?;娜斯と蝿?wù)??啃U力開路的初創(chuàng)公司有很多。例如,很多聊天機器人初創(chuàng)公司聘請人類擔(dān)任“AI訓(xùn)練師”,讓他們手動創(chuàng)建或核實虛擬助手作出的預(yù)測(實際效果各異,且員工流動率高)。就連科技巨頭都采用這種策略:Facebook虛擬助手M的所有回答,都由一支合同工隊伍進行檢查和編輯。
            
            只要數(shù)據(jù)網(wǎng)絡(luò)效應(yīng)在某個時候生效,所需人力不再跟隨客戶數(shù)量同步增加,那么用蠻力來手動標(biāo)記數(shù)據(jù)點的策略就能取得成功。一旦AI系統(tǒng)的進步速度夠快,不明確的異常值就會變得更少,進行手動標(biāo)記的人員數(shù)量就可以減少或者保持不變。
            
            適用于:幾乎所有的機器學(xué)習(xí)初創(chuàng)公司
            
            例子:
            
            *很多聊天機器人初創(chuàng)公司(包括Magic、GoButler、x.ai和Clara)
            
            *MetaMind(手動采集和標(biāo)記的食物分類數(shù)據(jù)集)
            
            *BuildingRadar(由員工/實習(xí)生手動標(biāo)記建筑物圖片)
            
            策略二:縮小范圍

            
            大多數(shù)初創(chuàng)公司都會試圖從用戶那里直接采集數(shù)據(jù),但問題在于,在機器學(xué)習(xí)的好處尚未全部體現(xiàn)出來之前,會很難說服早期采用者使用產(chǎn)品(因為先要有數(shù)據(jù)才能訓(xùn)練和改進算法)。避開這種兩難處境的一個方法是大幅縮小問題域(如果以后有需要再擴大范圍)??死锼?middot;迪克森(ChrisDixon)說:“你需要的數(shù)據(jù)量與你試圖解決的問題廣度有關(guān)。”
            
            關(guān)于縮小范圍的好處,聊天機器人再次成為很好的例子。這個領(lǐng)域的初創(chuàng)公司可以在兩個市場進入策略之間做出選擇:一種是打造水平型虛擬助手,也就是幫助解答很多問題并響應(yīng)即時請求的機器人,例如Viv、Magic、Awesome、Maluuba和Jam;一種是打造垂直型虛擬助手,也就是力求極為出色地完成某項明確具體工作的機器人,例如x.ai、Clara、DigitalGenius、Kasisto、Meekan和近期的GoButler。雖然兩個方法都可行,但解決閉域問題的初創(chuàng)公司在數(shù)據(jù)的采集上要容易許多。
            
            適用于:垂直整合型公司
            
            例子:
            
            *高度專業(yè)化的垂直型聊天機器人(比如x.ai、Clara和GoButler)
            
            *DeepGenomics(利用深度學(xué)習(xí)技術(shù)對基因變異進行分類和解讀)
            
            *QuantifiedSkin(利用客戶自拍照進行皮膚分析)
          我要評論
          • 國內(nèi)機器人領(lǐng)域投融資活躍!這五家企業(yè)宣布融資好消息

            國內(nèi)機器人領(lǐng)域投融資活動頻繁發(fā)生,為企業(yè)創(chuàng)新發(fā)展提供了強有力的資金支持。2025年5月,傲意科技、自變量機器人、艾豚科技、山東未來機器人、傲鯊智能等多家企業(yè)紛紛宣布融資好消息!
            機器人人形機器人投融資
            2025-05-14 11:21:58
          • 涉及電力、機器人等領(lǐng)域 近期企業(yè)融資動態(tài)匯總

            近日,不少科技企業(yè)宣布完成數(shù)千萬元融資,小編在本文中整理了近期數(shù)千萬元融資的科技企業(yè)。具身智能公司“自變量機器人”近日完成數(shù)億元A輪融資,由美團戰(zhàn)投領(lǐng)投、美團龍珠跟投;新能源檢測技術(shù)企業(yè)“川源科技”宣布完成數(shù)千萬元A輪融資......
            電力機器人
            2025-05-14 09:12:07
          • 浙江印發(fā)《浙江省推進“人工智能+教育”行動方案(2025—2029年)》

            行動方案還明確了五大項16個小項重點任務(wù),為全省未來5年“人工智能 教育”行動設(shè)計好了“施工圖”。如建設(shè)教育大模型基礎(chǔ)設(shè)施、探索教學(xué)新形態(tài)、構(gòu)建人工智能教育課程體系、開展教師人工智能素養(yǎng)培訓(xùn)等。
            人工智能教育
            2025-05-14 08:51:13
          • 十大新興技術(shù):人工智能演變成一種商業(yè)工具

            人工智能作為一種新興技術(shù),已經(jīng)不再是簡單的概念炒作,而是真正融入到企業(yè)的業(yè)務(wù)運營中,成為推動企業(yè)發(fā)展的核心力量。本文將深入剖析十大借助人工智能提升的熱門新興技術(shù),展現(xiàn)其在商業(yè)領(lǐng)域的廣泛應(yīng)用與巨大潛力。
            人工智能
            2025-05-14 09:38:03
          • 河南信息通信業(yè)牽頭制造、種植、教育領(lǐng)域省級人工智能行業(yè)賦能中心建設(shè)

            河南省確定了13家河南省人工智能賦能中心,各賦能中心通過整合算力、算法、數(shù)據(jù)等核心資源,搭建政產(chǎn)學(xué)研用協(xié)同平臺,推進人工智能技術(shù)攻關(guān)、場景建設(shè)、供需匹配。
            人工智能信息通信業(yè)
            2025-05-13 13:56:14
          • 推動“人工智能+物流”發(fā)展 對智慧城市建設(shè)有何意義

            今年一季度,在政策的助力下,物流裝備領(lǐng)域也是活力滿滿,從國產(chǎn)冷機實現(xiàn)量產(chǎn),到新能源貨車快速更新,物流裝備的綠色化水平不斷提升,有效助推物流運行效率的提升和物流成本的下降。
            人工智能物流
            2025-05-12 10:24:19
          版權(quán)與免責(zé)聲明:

          凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責(zé)任。

          本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、平臺或個人從本站轉(zhuǎn)載時,必須保留本站注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責(zé)任。

          鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

          不想錯過行業(yè)資訊?

          訂閱 智能制造網(wǎng)APP

          一鍵篩選來訂閱

          信息更豐富

          推薦產(chǎn)品/PRODUCT 更多
          智造商城:

          PLC工控機嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機械包裝機械工程機械倉儲物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機器人3D打印設(shè)備生物識別傳感器電機電線電纜輸配電設(shè)備電子元器件更多

          我要投稿
          • 投稿請發(fā)送郵件至:(郵件標(biāo)題請備注“投稿”)1271141964.qq.com
          • 聯(lián)系電話0571-89719789
          工業(yè)4.0時代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺
          智能制造網(wǎng)APP

          功能豐富 實時交流

          智能制造網(wǎng)小程序

          訂閱獲取更多服務(wù)

          微信公眾號

          關(guān)注我們

          抖音

          智能制造網(wǎng)

          抖音號:gkzhan

          打開抖音 搜索頁掃一掃

          視頻號

          智能制造網(wǎng)

          公眾號:智能制造網(wǎng)

          打開微信掃碼關(guān)注視頻號

          快手

          智能制造網(wǎng)

          快手ID:gkzhan2006

          打開快手 掃一掃關(guān)注
          意見反饋
          我要投稿
          我知道了