推特等公司要價太高,OpenAI 和 Cohere 等 AI 公司轉向組成數據 |
發布時間:2023-07-22 文章來源:本站 瀏覽次數:2204 |
7 月 20 日消息,人工智能公司 Cohere 首席執行官 Aiden Gomez 近來透露,因為 Reddit、Twitter 等公司的數據收集要價太高,包括微軟、OpenAI 和 Cohere 在內的 AI 公司,已運用組成數據來練習 AI 模型。 Gomez 表示組成數據能夠適用于許多練習場景,僅僅目前尚未全面推廣。 IT之家在此附上 Gomez 舉的一個例子:假如某個企業想在高等數學中練習一個模型,能夠創立兩個人工智能模型,分別扮演教師和學生的人物,并讓它們評論三角學之類的話題。人工首要擔任調查,假如看到有什么過錯,能夠進行糾正。 IT之家注: 組成數據(synthetic data)是經過計算機技術人工生成的數據,而不是由實在事件產生的數據。 但組成數據具備“可用性”,能夠在數學上或統計學上反映原始數據的屬性,因此能夠作為原始數據的替代品來練習、測試并驗證大模型。 |