GIGAZINE の記事
-
ウェブブラウザ単体でOCR処理を実行してAIで校正までできる「NDLOCR-Lite Web AI」レビュー、国立国会図書館のNDLOCR-Liteを簡単に利用可能にしたウェブアプリ
書類の写真や古文書の画像データを入力するだけでテキストデータとして文字起こしできるウェブアプリが「NDLOCR-Lite Web AI」です。
-
ウェブサイトが更新されたら通知してくれる無料ツール「Visualping」
ページを指定すればAIが定期的にアクセスして、前回と差異があったら自然言語で説明しつつ通知してくれるサービスが「Visualping」です。RSSを提供していないようなサイトでもバッチリ差分を検知してくれるとのことで、どこがどう検知されるのか、アカウント登録して無料版を実際に使って確かめてみます。
-
カンニングを目的としたスマートグラスのレンタルが増加
AIスマートグラス市場が成長した結果、リアルタイムナビゲーションやライブ翻訳など便利に使われる一方で、カンニングなど不正行為に利用されるケースも増えていると、海外メディアのRest of the Worldが伝えました。
-
画像や音声に対する人間の脳の反応を正確に予測するAIモデル「TRIBE v2」をMetaが公開
ほぼあらゆる視覚や音に人間の脳がどのように反応するかを予測するよう訓練された基盤モデルが「TRIBE v2」です。
-
Metaが動画内の物体を切り抜くAIモデル「SAM 3」の複数オブジェクトの追跡能力を向上した「SAM 3.1」をリリース
Metaは2025年11月、画像や動画内のオブジェクトを検出・分割・識別するためのAIモデル「Meta Segment Anything Model 3(SAM 3)」を発表しました。
-
MicrosoftのAI「Copilot」が勝手にプルリクエストに広告を挿入
GitHubのプルリクエストでCopilotを呼び出したところ、勝手に広告を挿入されてしまったと開発者が報告しました。
-
「OpenAIとAnthropicのAIモデルを1つのプロンプトで同時実行する機能」がMicrosoft 365 Copilotに追加される
MicrosoftのAIサービスである「Microsoft 365 Copilot」のリサーチ機能(Researcher)で、「2つのAIモデルを同時実行して高品質なレポートを作製する機能」のテストが始まりました。
-
OpenAIがClaude Code用のCodexプラグインをリリース、ユーザーはClaude Code内からCodexを呼び出してコードレビューやタスクの委任を実行可能に
OpenAIがClaude Codeのワークフロー内で直接OpenAIのCodexを利用してコードレビューやタスクの委託を行うためのプラグインを2026年3月31日に正式にリリースしました。
-
OpenClawを簡単にインストールできるGUIアプリ「AutoClaw」を中国企業のZ.aiが公開
OpenClawは自分専用のAIエージェントをPC上に常駐させられるシステムで、日常作業や業務を効率化できるシステムとして注目を集めています。そんなOpenClawを簡単に使えるようにする「AutoClaw」がGLM-5などの高性能AIで知られる中国企業のZ.aiによって開発されました。
-
「Qwen3.5-Omni」が登場、文章生成・コード生成・映像認識・音声合成・ウェブ検索が可能
AlibabaのAI研究チームであるQwen(Tongyi Lab)が「Qwen3.5-Omni」を2026年3月30日に発表しました。Qwen3.5-Omniはテキスト・画像・音声・動画の理解が可能なオムニモーダルモデルで、テキストだけでなく音声も生成することが可能。