近幾年,機器寫作不再是紙上談兵的技術,已然滲透到了我們的生活之中。今日頭條、騰訊、百度、360等公司,以及新華社、南方都市報、第一財經等傳統媒體單位均開展了機器寫作技術的研究與應用。
不久前,在北京大學科技成果發布會暨北京市科技成果轉化統籌協調與服務平臺系列項目路演中,北京大學計算機科學技術研究所研究員萬小軍的AI寫作機器人頗受關注。
據介紹,這項成果已應用于多家媒體單位,研發單位與各媒體單位合作推出了小明、小南、小柯等多款寫作機器人,各類機器人已經自動撰寫新聞稿件十萬多篇。
除了新聞寫作,還能應用于這些領域
機器寫作,又稱自然語言生成,是自然語言處理領域的重要研究方向和研究熱點之一, 也是人工智能走向成熟的重要標志之一。
目前,機器寫作在傳媒、出版、文娛、廣告等多個行業均具有廣闊應用場景。歐美等地較早成立專注于機器寫作技術應用的多家公司,例如ARRIA、AI、NarrativeScience等基于行業數據,通過機器寫作生成行業報告或新聞報道,從而節省大量人力。同時,不少國外知名媒體單位紛紛采用機器寫作技術進行新聞稿件創作,以節約人力成本,提高效率。
“與人類作者相比,機器寫作具有效率高、時效性好、覆蓋性強、無偏見等優勢。今日頭條的線上測試表明,機器人撰寫新聞稿件的閱讀率與人工稿件的閱讀率基本相同,這說明機器稿件的質量不錯,能夠被廣大用戶所接受。”萬小軍告訴記者。
萬小軍說,我們希望計算機同時具有讀與寫的能力,除了掌握閱讀和理解語言文字的本領之外,還能夠掌握文字創作的本領,從而像人類一樣寫出高質量的文字作品,例如新聞資訊、報告、詩歌、小說、作文等。
然而,計算機不能憑空寫作,必須根據所輸入的數據與素材進行創作。據介紹,根據輸入的不同類型的信息,計算機一般采用不同的寫作方式進行創作。例如,計算機根據輸入的結構化數據(報表、RDF數據等)進行文字創作,從而能夠生成稿件。這是目前機器寫作應用的主要方式,適用于天氣預報、醫療報告、賽事簡訊、財經報道等文本的生成。
萬小軍介紹說,近幾年機器寫作除了用于撰寫新聞、報告等實用型文本之外,還被用于創作古詩、現代詩、散文等文學作品,例如微軟小冰、清華九歌等系統分別能夠創作現代詩和古詩,在文字表現形式上的總體效果還不錯,但在意境上有所欠缺。
深度學習生成模型,但還難保準確性和可讀性
近幾年,深度學習發展迅速,機器寫作技術也受到其深刻影響。
據萬小軍介紹,基于深度學習技術進行文本生成,不依賴于模板或規則。然而,這樣的寫作方式雖然在研究上取得一定進展,但目前還不能保證所生成稿件的準確性與可讀性,難以滿足很多應用場景下對稿件的質量要求。此外,深度學習生成的模型訓練需要大量的平行語料,而在很多領域內較難獲取到這樣的大規模語料。
計算機根據已有的文字素材(例如已經發表的新聞)進行二次文字創作時,能夠基于已有稿件創作出不一樣的稿件,主要依賴于兩類自然語言處理技術:自動文摘與文本復述。其中自動文摘用于對單篇文本或多篇文本進行內容提煉與綜合,形成摘要或綜述。
萬小軍指出,多文檔自動文摘比單文檔自動文摘更具有挑戰性,原因在于不同文檔內容的冗余性、片面性與弱連貫性。因此,對多篇新聞報道進行長篇綜述生成極其困難,其研究團隊在這方面進行了嘗試,提出基于段落排序與融合的方法為多篇新聞報道進行綜述生成,取得一定效果。
文本復述則用于對現有文字進行改寫,在主題與意思基本不變的前提下產生另一種文字表述,從而避免原文照抄,也可實現文本風格化的目的。文本復述可以看作是一種單語言機器翻譯問題,因此在平行語料充足的前提下,各種統計機器翻譯方法(包括神經網絡機器翻譯)均可應用于此問題。但現實中卻難以獲得大規模的此類平行語料,因此針對文本復述的研究需要另辟蹊徑,最新的研究主要集中在如何有效利用少量的平行語料和大規模的非平行語料進行復述模型的學習。
揚子晚報網6月14日訊(通訊員張愛國記者梅建明)6月12日上午,事故當事
注意!今日暴雨來襲未來三天福建以陰雨天氣為主雨水上線,暫享清涼最新
流量時代,企業爭相發力線上,變著花樣引流不足為奇。即便是老牌企業如
愛范兒早報導讀披頭士最后一曲,AI協助完成ChatGPT推送重要更新多地高
提到工具,你想到的是什么?辦公場景中的掃描、傳輸、會議等工具,還是
上海市科學技術委員會近日印發《上海市“元宇宙”關鍵技術攻關行動方案
本場賽后,巴特勒和洛瑞出席了新聞發布會。記者向巴特勒提問:在控
作戰室內,編隊指揮員密切關注戰場態勢,指揮各艦迅速組成對空防御隊
相信大家對商務標書包括哪些內容,五羊本田哪些是獨立標?的問題都很疑
華夏時報記者付樂冉學東北京報道近日,《華夏時報》記者發現,微信支付
同花順數據顯示,2023年6月13日,浙富控股獲外資賣出67 14萬股,占流通
鄂軍贏得開門紅,13支三人女籃青年軍鏖戰江城---6月13日上午,“漢水杯
我從______大學光纖專業畢業后,于8月開始在縣通信分公司工作。我從事
北京遇上西雅圖演員表,京遇上西雅圖演員表的基本詳情介紹很多人還不知
兩年后,我才知道為什么趙麗穎的婚姻如此倉促,拖了這么久。2018年5月
安徽安慶市正式成立“老年助餐慈善基
記者日前從安慶市民政局獲悉,該市慈善會近日設立老年助餐慈善基金,共同守護老年人舌尖上的幸福。該基金專項用于資助城鄉社區老年食堂、社
安徽淮北積極落實2022年電網防汛度汛
近日,國網淮北供電公司工作人員來到110千伏中泰變電站開展防汛隱患排查。該公司積極落實2022年防汛度汛措施,提前細化應急預案,推進極端
安徽全椒縣完善拓展人力信息資源助企
今年以來,全椒縣不斷完善拓展人力資源信息庫、勞務對接信息庫、企業用工需求信息庫三庫信息資源,已摸排400多家次企業缺工崗位信息1 2萬個
宿州市埇橋區柔性引進博士推進鄉村振
宿州市埇橋區實施博士匯工程,柔性引進29名博士擔任副鄉鎮長或園區副主任,他們將為加快產業發展、推進鄉村振興強化智力支持。目前,博士專
安徽印發出臺全面實施零基預算改革方
為進一步提高財政資源配置效率和資金使用效益,省政府印發《安徽省全面實施零基預算改革方案》,明確從編制2023年預算起,在全省范圍內全面
5月份安徽居民消費價格同比上漲2.3%
近日,國家統計局安徽調查總隊發布了我省5月份居民消費價格統計數據。統計顯示,我省居民消費價格同比上漲2 3%,同比漲幅比上月回落0 4個百分
安徽多種方式引導群眾防范非法集資風
合肥地鐵1號線、3號線上滾動播放防范非法集資宣傳視頻,淮南市發布《致老年群眾的一封信》……6月份是一年一度防范和處置非法集資宣傳月,今
鐵路部門持續加大長三角地區運力投放
記者從中國鐵路上海局集團有限公司獲悉,隨著上海疫情防控形勢持續向好,為進一步適應旅客出行需要,助力復工復產,鐵路部門自6月10日起持續加
安徽六安持續精準施策全力促進工業發
六安市與蔚來汽車簽署合作協議,共建智能電動汽車零部件配套產業園區。該園區一期計劃2023年上半年投產,建成后將具備年產30萬噸鋁壓鑄產能,
安徽淮北全力維護外賣送餐員合法權益
為切實防范化解新業態領域重大風險隱患,強化外賣送餐員權益保障工作,淮北市市場監管局充分發揮職能作用,全力維護外賣送餐員合法權益。淮北
湖南漣源開展專項行動一對一為企業紓
位于漣源市的湖南三合美新材料科技有限公司,兩條生產線滿負荷運行,生產聚氨酯和巖棉復合板。因產品升級與產能擴充,急需新增兩條生產線,
湖南藍山縣進村入戶排查整治自建房安
老叔,這棟房屋墻體有開裂痕跡,要維修加固,安全重要!5月20日,藍山縣塔峰鎮果木村,黨員干部上門開展農村自建房安全隱患排查整治。連日來
一季度湖南萬元產值綜合能耗同比下降
近日,湖南省工業通信業節能監察中心發布一季度全省六大高耗能行業能源消耗統計監測報告。據該報告,一季度全省146家主要高耗能企業的萬元
濟南起步區一年來累計簽約優質項目11
萬里黃河第一隧濟南黃河濟濼路隧道建成通車,占地4000余畝的新能源乘用車零部件產業園加快施工……記者21日采訪獲悉,建設實施方案獲批復一
山東發布通知啟動傳統民居保護利用試
省住房城鄉建設廳、省財政廳近日聯合印發《關于做好傳統民居保護利用試點工作的通知》,在全省部署開展傳統民居保護利用試點工作。此次試點