推特等公司要價太高，OpenAI 和 Cohere 等 AI 公司轉向組成數據

發布時間：2023-07-22 文章來源：本站瀏覽次數：2204

7 月 20 日消息，人工智能公司 Cohere 首席執行官 Aiden Gomez 近來透露，因為 Reddit、Twitter 等公司的數據收集要價太高，包括微軟、OpenAI 和 Cohere 在內的 AI 公司，已運用組成數據來練習 AI 模型。

Gomez 表示組成數據能夠適用于許多練習場景，僅僅目前尚未全面推廣。

IT之家在此附上 Gomez 舉的一個例子：假如某個企業想在高等數學中練習一個模型，能夠創立兩個人工智能模型，分別扮演教師和學生的人物，并讓它們評論三角學之類的話題。人工首要擔任調查，假如看到有什么過錯，能夠進行糾正。

IT之家注：

組成數據（synthetic data）是經過計算機技術人工生成的數據，而不是由實在事件產生的數據。

但組成數據具備“可用性”，能夠在數學上或統計學上反映原始數據的屬性，因此能夠作為原始數據的替代品來練習、測試并驗證大模型。

上一條：繼微信之后，付出寶宣布境...

下一條：《2023胡潤我國元世界...