業界・業務から探す
導入目的・課題から探す
データ・AIについて学ぶ
News
Hakkyについて
ウェビナーコラム
◆トップ【ニュース】
AI/機械学習の進化によるセキュリティの変化とChatGPTのモニタリング2024年の生成AI予測:海外トップVCの見解病状をAI分析、救急隊支援アプリに全国切符 八幡平の企業開発<AIと創造力 表現者編>新たな表現が照らす人間らしさ生成AIが主役の2023年、法的・経済的な課題が残るAIによる「ドゥームスクロール」が悪化する可能性AIの進化から医療のブレイクスルーまで 2023年の科学ニュース10選英語学習におけるAIツールの活用方法米政治家のAI活用、2024年選挙に懸念の声AI活用で仕事効率化!生成AIの活用方法とは?ビル・ゲイツ氏、AIによる地球規模の医療改善に期待AIの成長による懸念と注目脳とAIをつなぐことで実現する7つのことコアテック、CGキャラクターを活用した自然な対話のためのインタロボット開発ディープフェイクの脅威と対策 - 東工大准教授に聞く生成AIリスクの研究拠点 新設方針亡き妻の声、生成AIで曲を作り出す男性メタ、AIに心理学を応用した「本当に求められている応答を生成する」技術を開発AI技術による動画編集ツールの台頭と需要増加生成AIの急速普及、2024年の展望は?宿題の意義を問う「学校の宿題」の意義AGIの実現可能性と議論の最新動向AI企業の高品質データ争奪戦2024年は生成AIで「データ」が変わる年に:11の予測スマホでAI検知、道路の白線早期補修へAI「人類存続に脅威」 国連諮問機関が規範訴えアサヒ飲料の新商品、AI予測で収益拡大大型AIモデルが小型AIモデルを構築...「自己進化するAIに向けた第一歩だ」明治安田、営業に生成AI 25年度、最適な保険提案NEJMグループ、医療分野に特化したAI/機械学習専門誌「NEJM AI」を創刊小説家とAIが競作した物語ラウンドアップ:生成AIの台頭と影響STEM偏向は「自滅の種」、ノーベル賞経済学者がAI台頭で警告ローコードで使える「Copilot Studio」とは? AIアシスタントを独自作成地域の足維持のキーワードはAI 大館で定額制乗り合いサービス、実証進む(対談)AI・言語・思考 今井むつみさん×瀬名秀明さん生成AI、混沌の時代の先にAI思考のノウハウを教える『AI思考は武器になる』発売!大型AIモデルが自動的に小型AIツールを構築、自己進化するAIへの第一歩仕事始め式で市長の画像が生成AIで動き出す!出席者を驚かせる米マイクロソフト、パソコンにAI起動キーを追加PathlightのAIエージェントが顧客との会話を100%分析、その真価とは?中小企業の生成AI導入、プロンプトのテンプレート化で後押し——豪Relevance AI、14.5億円を調達生成AIの活用が企業に広がるAIがビジネス成果に結実する「AI Everywhereな世界」au三太郎シリーズ、生成AIでリメイクしたお正月CMを放映DMM英会話のAI英会話サービス「DMM英会話 AI」の成功の秘訣と今後の展望
AI

執筆者:Hakky AI

AI企業の高品質データ争奪戦

ニュースの要点

info
3行まとめ
  • AI開発競争はデータ争奪戦の様相を呈している。
  • AIモデルの能力向上のためには、より複雑な情報を学習させる必要がある。
  • AI企業は高品質なデータを求めており、データ争奪戦のコスト負担が増加している。

ニュース詳細

最先端のAIモデルは、既に米国の司法試験で高得点を取ったり、人間のような文章を書くことができるようになっています。しかし、これらのモデルの能力を向上させるためには、より複雑な情報を学習させる必要があります。そのためには、画像や科学論文などの高品質なデータが必要です。しかし、これらのデータは入手が困難であり、価格も高いのが現状です。

AIの高度化は、学習データの質に大きく依存しています。交流サイト(SNS)への投稿などはインターネット上で簡単に見つけることができますが、偏見を含んでいる可能性があります。そのため、AI企業は専門家が著した科学論文や本など、より信頼できる情報源を探しています。調査機関エポックの研究者によると、インターネット上では無料で入手できる高品質な単語が17兆個ある一方、低品質な単語は7京1000兆個もあると試算されています。

現在のペースでデータを読み込ませ続ければ、AIモデルは2026年までに優れたデータを学習し尽くす可能性があります。一つの打開策として、開発者が特定のモデルでの使用を想定してAIで新たにデータを生成することが挙げられます。すでにデータ生成サービスを提供する企業も存在し、クレジットカード大手のアメリカン・エキスプレスや自動運転技術を開発するウェイモなどが合成コンテンツを使用しています。調査会社ガートナーによると、2024年にはAIデータの60%が合成データになると予想されています。

しかし、AIモデルは依然として実世界のデータを必要としています。大手出版社や記録保管施設が所有するデータは、AI企業にとって大きな利益をもたらす可能性があります。例えば、法律分野のデータベースを傘下に持つ英レレックスの株価は過去1年で30%以上上昇しています。また、米紙ウォール・ストリート・ジャーナルや英紙タイムズを発行するニューズ・コープもAI企業との交渉を行っており、大きな収入が期待できるとしています。

出典

2025年06月14日に最終更新
読み込み中...