前幾日在2020亞太新經濟大會(秋季線上峰會)上,云測數據展示了智能駕駛領域AI訓練數據解決方案,并獲得“2020年度人工智能產品/平臺”榮譽獎項業界關注的一大亮點。
那么,無人化智能駕駛快速發展的背后擁有那些前沿技術方面的突破?云測數據能夠帶來哪些解決方案?帶著這些問題,記者采訪了云測數據總經理賈宇航。
“數據場景實驗室”
為智能駕駛裝上一雙“智慧眼睛”
眾所周知,AI數據在整個人工智能各個領域扮演著“血液”的角色,它在智能駕駛領域的重要性同樣至關重要。
長期以來,無人駕駛技術的難點在于如何讓汽車具備一雙“智慧眼睛”,如何有效讓汽車變得更“聰明”的關鍵。
“云測數據在智能駕駛領域數據標注領域長期保持著優勢。”云測數據賈宇航介紹,云測數據為了滿足智能駕駛領域不同場景的特殊需求,在業內首創了“數據場景實驗室”模式,通過還原多種智能駕駛細分場景,以解決特定場景下的數據缺失、質量良莠不齊等行業問題。一方面在場景下的定制化數據采集數據質量更高,另一方面場景化數據也與智能駕駛需求端的匹配度更高,從而將數據轉化為生產力。
據悉,在在標注工具方面,云測數據自研了一套可以支持圖片、語音、文本等多品類的標注平臺,可滿足業內圖片通用拉框、車道線、DMS、3D點云、2D/3D融合、全景語義分割等標注類型,支持自動駕駛、智能駕艙、自動泊車等場景數據標注。
“視覺語音文本全品類支撐”
建立數據核心壁壘,推動自動駕駛規模化落地
隨著初級輔助駕駛功能的逐步應用,自動駕駛不再遙不可及,正變成觸手可及的真實體驗。據艾瑞咨詢報告顯示,2030年全球自動駕駛滲透率則將增加至70%。
“對于智能駕駛來講,無噪的場景數據采集完成后,需要通過標注后或者說加上標簽才有意義,才能用于算法的學習和訓練,應用到智能駕駛落地。”賈宇航介紹,為保證數據交付的質量,云測數據搭建了場景實驗室和數據標注基地進行相應的數據生產。在項目前期,云測數據項目經理會幫助客戶梳理更貼合實際情況的需求,試標驗收合格后開始大規模作業。在數據標注作業提交后,還有三層質檢環節和抽檢環節來確保數據的高質量輸出,并有項目經理全程跟蹤數據交付的流程。
具體而言,就是在擁有貼合場景落地的大量數據后,高質量的數據標注就顯得更為重要。數據標注的意義是教會機器理解并認識世界,從而幫助智能駕駛更好的感知道路環境。云測數據支持市面上語音、文本、圖像等所有的標注類型,包括分類、畫框、注釋、標記等等,經過多重審核流程,確保準確率來保持標注質量。
據介紹,云測數據在標注工具方面,自研了一套可以支持圖片、語音、文本等多品類的標注平臺,可滿足業內圖片通用拉框、車道線、DMS、3D點云、2D/3D融合、全景語義分割等標注類型,支持自動駕駛、智能駕艙、自動泊車等場景數據標注。
值得一提的是云測數據的三維標注工具,尤其是3D點云的標注工具,通過渲染引擎等方面的優化,可保證整個過程的流暢和快捷。對雷達成像的圖像中的機動車、障礙物、行人等多目標進行3D標注,也是業內率先實現2D、3D融合標注的平臺之一。在數據質量的導向下實現更優的品控和更快的數據交付。
賈宇航認為,作為人工智能領域內值得期待的場景,智能駕駛產業落地的大門已然開啟。場景化、定制化的高質量的數據已成為智能駕駛領域需要的基礎動力之一,而數據產業也將在不斷深入的產業落地中,為科技的進步和發展貢獻著力量。
“高質量AI數據”
用攀爬珠峰的精神,去做高質量的智能駕駛AI數據
賈宇航在接受媒體記者采訪時表示,其實自動駕駛除了需要軟件、硬件等強大的技術支撐外,還需要有“高質量AI數據”做支撐。
不僅僅是“口號”,云測數據正在用實際行動踐行著“高質量AI數據”的標準。據了解,在今年首場重大國際經貿活動服貿會上,云測數據作為據標注行業的龍頭企業受邀參加成果展示,代表行業發布了一項重要成果,云測數據項目高交付達到了99.99%,成為目前數據標注領域可達到的服務標準,創造了行業的新標桿。
賈宇航透露,自從涉足自動駕駛領域數據標注以來,云測數據僅在難度較大的3D點云數據上,就輸出了千萬幀級別的AI數據。這些AI數據應用于智能駕駛感知系統的優化進步,助力算法工程師和企業們在3D感知、場景理解等方面取得進展。
正是擁有定制化的場景、豐富的數據量和高質量的AI數據交付,才讓云測數據與行內包括自主、合資車企,大型Tier1以及做無人出租車的自動駕駛公司等眾多企業的親睞。
隨著AI技術商業化的持續深入,算法、算力方興未艾之時,高質量、場景化的數據成為推動智能駕駛深入長尾應用的關鍵推動力。在記者看來,無人駕駛不能只追求技術,要讓數據與技術發揮更大的商業化價值,無人駕駛技術的推進和創新需要高尚的情懷使命做支撐,甚至需要用攀爬珠峰的精神,去做好無人駕駛技術的產業落地才行。