「Tokenmaxxing」とは、CEOが従業員にAIをできる限り使い倒すよう促した動きを指す。2026年前半、シリコンバレーではこのトレンドが最高潮に達し、各社がAIツールの利用拡大を積極的に推進した。しかし今、その反動が本格的に到来している。TechCrunchの報道によれば、NEAのパートナーであるティファニー・ラック氏は「企業はいまだにAIのROIを模索している段階だ」と指摘している。
具体的な動きとして、Uberが年間AI予算を数ヶ月で使い切ったことが相次いで報じられている。また組織の一部でClaude契約を削減した企業も出ており、MetaはAI利用を社員同士で競わせていた社内リーダーボードを廃止した。「とにかく使え」という号令で積み上がったコストの請求書が届き始めた形で、支出拡大の圧力と費用対効果への厳しい目線が真正面から衝突している。
「Tokenmaxxing」とは、CEOが従業員にAIをできる限り使い倒すよう促した動きを指す。2026年前半、シリコンバレーではこのトレンドが最高潮に達し、各社がAIツールの利用拡大を積極的に推進した。しかし今、その反動が本格的に到来している。TechCrunchの報道によれば、NEAのパートナーであるティファニー・ラック氏は「企業はいまだにAIのROIを模索している段階だ」と指摘している。
具体的な動きとして、Uberが年間AI予算を数ヶ月で使い切ったことが相次いで報じられている。また組織の一部でClaude契約を削減した企業も出ており、MetaはAI利用を社員同士で競わせていた社内リーダーボードを廃止した。「とにかく使え」という号令で積み上がったコストの請求書が届き始めた形で、支出拡大の圧力と費用対効果への厳しい目線が真正面から衝突している。
ラック氏はTechCrunchのポッドキャストでAI IPOの見通しやパーソナルエージェントの将来についても語りながら、この緊張関係に繰り返し言及した。企業のAI活用フェーズが「とにかく使え」から「効果を証明せよ」へと移行しているのは明らかだ。支出の可視化とROI測定の仕組みを持たない組織は、次の予算サイクルでさらに厳しい見直しに直面するとみられる。
AI中級者にとって、この流れは他人事ではない。自社・自チームのAIツール支出を今週中に棚卸しし、どのワークフローで実際にコストが削減されたか、売上や生産性にどう貢献したかを数値で示せる状態にしておくことが、今後の予算確保に直結する。ROIを可視化できないツール利用は、次の予算サイクルで真っ先に削られるリスクがある。
ZeroGPUは2026年6月17日、軽量なAIタスクをSLM(小型言語モデル)へ自動振り分けするClaude Codeプラグインをオープンソースで公開した。同プラグインはClaude Code上で動作し、コーディング中に発生する負荷の軽いタスクをClaudeではなく専門化された小型モデルに委譲することで、AI計算コストの削減を狙う設計だ。joshdappierがHacker Newsに「Show HN」として投稿し、関心を集めた。
6月15日には開発者danmeierが、Claudeのデスクトップアプリで消費したトークンの内訳を可視化する「Claude Token Analyzer」をHacker Newsで発表した。スマートフォンのスクリーンタイムレポートになぞらえた設計で、集計に必要なデータは追加収集不要——Claudeデスクトップアプリがすでにユーザーのディスク上に記録済みだという。danmeier自身は「一日の約95%をClaudeデスクトップアプリで過ごしている」と述べており、日常業務がClaude依存になった実務者のコスト意識を象徴するコメントとなった。
同日、nickvと共同創業者らのチームはClaude CodeやCodexの動作をリアルタイムで可視化する「Spotlight」(backplanes.com)をHacker Newsで初公開した。GitHubでも前後して、C#/.NET 10向けAIエージェント最適化ツール「AiNetLinter」、医師研究者が論文業務で検証した「medsci-skills」(MITライセンス)、学術研究者向けエージェント設定「claudeblattman」などドメイン特化ツールが続出している。AnthropicのClaude Code責任者ボリス・チェルニー氏が6月11日の日経クロステック取材で設計理念として「デザイア・パス」を掲げたように、外部エコシステムの自律的な多様化はその思想の具体化とみられる。
帝国データバンクが実施した調査によると、AIエージェントを活用している国内企業の86.7%が業務上の効果を確認していることが明らかになった。GMOあおぞらネット銀行は全社的な「AI銀行宣言」を打ち出し、名刺管理サービスのSansanは13体のAIエージェントを実務に並走させるなど、先行組の実装規模も拡大している。単なる概念実証(PoC)を超えた運用実績の積み上げが、業種を問わず2026年前半の国内企業の共通トレンドとなっている。
約1700万人の顧客を抱えるかんぽ生命保険は、郵便局の窓口での何気ない会話からニーズを拾い上げ、担当者に保険提案のきっかけを示すAIエージェントを営業フローに組み込んだ。同社が公開したデモンストレーションでは、顧客の発言をAIがリアルタイムで分析して具体的な提案トリガーを示す流れが紹介された。大規模な顧客基盤を持つ金融機関が「AI補助×人間判断」型の営業支援を実装した事例は、中規模の保険・金融機関にとって参照価値の高いアーキテクチャとなる。
JR東日本はNECと共同でみどりの窓口への生成AI導入検証を開始した。乗客が音声でAIと対話して乗車券購入に必要な情報を整理し、その結果を窓口係員に引き継ぐ「ハンドオフ型」の設計を採用している。AIに判断を委ねるのではなく情報収集と整理を担わせて人間の意思決定を補佐するアーキテクチャは、エイトレッドの調査でワークフロー承認をAIに委ねるべきでないとする回答が7割を超えた結果とも整合する、現時点での現実的な導入パターンだ。
AIエージェントの全社展開を支える管理基盤の整備も並行して進んでいる。セゾンテクノロジーは複数エージェントを統合的に運用・管理するプラットフォーム「Agent Orchestration」を2026年7月1日から提供開始すると発表した。Sansanのように十数体のエージェントを並走させるフェーズに移行する企業が増える中、管理基盤なき全社展開がボトルネックになるとみられており、インフラ層の需要が急拡大している。大阪ガスが日本IBMおよびオージス総研との共創パートナーシップのもとでAI駆動開発とシステムモダナイゼーションを進めるなど、大手企業による中長期的な体制構築も本格化している。
調査会社の米Gartnerは2026年6月、日本企業の73%がシャドーAI——会社が認可していないAIツールを従業員が業務で使う行為——に対策できていないという調査結果を発表した。生成AI普及にともない、従業員が個人的に使い慣れたツールを持ち込む事例が急増しており、企業が選定したAIだけを利用させるポリシーはすでに形骸化しているとGartnerは指摘する。
こうした状況への対処として、現場エンジニアが独自のOSSツールを相次いで公開している。GitHubユーザー「nold-ai」が開発した「specfact-cli」は、Pythonチームを対象としたAIコード肥大化防衛CLIだ。決定論的なコードレビュー・クリーンアップ予測・仕様書や契約エビデンスの生成をサポートし、AI支援開発やブラウンフィールド(既存システム改修)案件での品質担保を目指している。
レガシー産業で長年働くエンジニアのrefsab氏は、PR(プルリクエスト)が変更するデータや数値をdiff形式で可視化するツール「data-review」をGitHubに公開した。同氏は「AIを使う人が増えてきたが、多くの人はvibe codingで結果を確認していない。自分がいつもデータの後始末をする」と開発の動機を明かし、開発者自身がマージ前にデータ変化を自己点検できる仕組みを提供した。
LLMを評価者(ジャッジ)として活用する現場では、判定根拠の不透明さも課題として浮上している。ML0037(MatteoLeonesi)氏が公開した「claim-memory-graph-sdk」は、LLMジャッジの出力をclaims・evidence・verdictsの三層に分解し、エビデンスに裏付けられていない判定を自動フラグ立てして手動確認を促す。規制対応の面では、lc-complyedge氏によるPython向けランタイムEU AI Act準拠強制ツール「ComplyEdge」も登場し、法規制への対応圧力が実装レベルで現実化しつつある。
MCPエコシステムの拡大が具体的な数字として見えてきた。GitHubで公開されたfireflyiii-mcp(作者: daften)は、オープンソースの個人財務管理ソフトウェアFirefly IIIをMCPクライアントから操作可能にするサーバーで、stdioトランスポート経由のPAT認証とHTTP経由のOAuth認証の2方式に対応する。提供ツール数は140に上り、AIエージェントが予算管理・支出分析・取引記録といった財務オペレーションを直接呼び出せる構成だ。家計管理から中小企業の財務自動化まで幅広い用途が想定される実装例といえる。
投資ポートフォリオ管理でも同様の動きが出ている。fenek-portfolio-companion(作者: Guck111)は、EU圏のウォレット・取引所・ブローカーをまたいだポートフォリオを集約してAI分析に提供する読み取り専用MCPサーバーだ。プロジェクトの説明には「データはすべてローカルに留まり、テレメトリーは一切送信しない」と明記されており、金融情報をクラウドに送らずにAI分析を実現するプライバシー重視の設計が採用されている。金融規制が厳しい欧州の実務者が主なユーザー層とみられる。
MCPのセキュリティ基盤整備も並行して進む。AuthPlane(作者: AuthPlane)はMCP向けのOAuth 2.1・PKCE認証サーバーをオープンソースで提供するプロジェクトで、GitHubに公開された。自社のMCPサーバーを外部エージェントに公開する際、トークン管理や認可フローの実装が必要になる局面が増えているが、AuthPlaneはその認証レイヤーを丸ごと担う基盤として機能するとみられる。プロトコル層に認証インフラが整いつつあることで、エンタープライズ利用の障壁が下がる方向だ。
自動化エージェントとMCPの組み合わせも実用段階に入っている。Orchid(orchid.ai)は「ゼロセットアップ」をうたうプロアクティブAIアシスタントで、MCP経由での外部ツール連携と定期タスク実行を主要機能として打ち出す。開発者はHacker Newsで「日次メール&カレンダーダイジェスト」などを実際のユースケースとして紹介した。コードベース横断検索をMCP経由で提供するCodeSummary(codesummary.io)も同時期に登場しており、MCPサーバーの用途は財務・認証・知識管理・自動化と多岐にわたって広がっている。
Sakana AIは6月15日、同社初の商用プロダクトとなるビジネス向け自律型リサーチアシスタント「Sakana Marlin(サカナ・マーリン)」の提供を開始した。同サービスは4月からβ版として提供されてきたものを正式に商用化したもので、リリースに先立ちSakana AIはメディア向けにハンズオンを実施した。事前に集めたテーマを基にAIが作成したレポートを報道陣に公開し、サービスの実力をアピールした形だ。
注目されるのは「ベンチマークも追わない」という明確な姿勢だ。先行するDeep Researchをはじめ各社が性能指標での競争を繰り広げる中、後発参入となるSakana AIはあえてベンチマーク数値の最大化を目標に置かない戦略を打ち出している。担当者への取材によれば、Marlinはビジネス向けの自律型リサーチに特化した設計であり、汎用的な数値指標では捉えきれない実務上の有用性を重視しているとみられる。
リサーチエージェント市場ではDeep Researchが先行しているが、Sakana Marlinの商用化によって日本発の選択肢が新たに加わった形だ。ビジネス向けリサーチ特化という立ち位置は汎用型ツールとは異なる切り口であり、調査テーマや用途によって使い分けることが可能になるとみられる。ベンチマーク数値ではなく実務上の有用性を評価軸に据えることで、自社の調査ワークフローに合ったツール選択の選択肢が広がりつつある。