AI技術の進化が新たな段階に入り、今後の可能性が大きく広がろうとしています。米国のAI開発企業、Anthropic社は、同社の最新AIモデル「Claude 3.5 Sonnet」の最新バージョンが人間と同じようにパソコンを操作する能力を備えたと発表しました。この機能は、現在パブリックベータ版としてAPI経由で開発者に提供されています。
パソコンを操作できるAIの登場
Claude 3.5 Sonnetの最新バージョンは、パソコンの画面を「見る」ことで、マウスを動かしたりボタンをクリックしたり、仮想キーボードを使って文字入力を行うことが可能です。これにより、これまでテキストや画像の理解に限定されていたAIの応用範囲が、大幅に拡大することが期待されています。この技術は、単純なソフトウェア操作を超え、さまざまな場面でAIが人間のパソコン操作をサポートする未来を予感させます。
安全性と開発の課題
Anthropic社は、この新技術の開発において、セキュリティ面での対策も重視しています。特に「プロンプトインジェクション」などの悪意ある指示でAIが誤動作するリスクに対しては、厳重な安全対策が講じられています。また、選挙やソーシャルメディアに関連する操作には、特別な監視体制を導入している点も特徴です。
ベータ版でのリリースと今後の展望
現時点では、この機能は試験段階にあり、操作の正確性には課題が残ることが明らかです。しかし、Anthropic社はベータ版をリリースすることで、開発者からのフィードバックを受けながらモデルの改善を進める方針です。これにより、AIがパソコンを介して複雑なタスクをこなす未来が、より現実味を帯びてきています。
Developing a computer use model
Claude 3.5 Sonnet, and Claude 3.5 Haiku
https://www.anthropic.com/news/developing-computer-use
https://www.anthropic.com/news/3-5-models-and-computer-use