画面の中の猫は、猫ではなかった。
正確には、猫かどうかを判定するのが、瀬戸咲良の仕事だった。画像が表示される。猫がいるかいないか、ラベルをつける。猫がいれば「cat」、いなければ「not_cat」。次の画像。また次の画像。一時間に約三百枚。一日八時間で二千四百枚。
咲良は二十四歳。AIスタートアップ「Prism AI」のデータアノテーター——社内ではそう呼ばれている。求人票には「AIトレーニングスペシャリスト」と書いてあった。面接のとき、CTOが言った。「あなたの判断一つひとつが、AIを賢くする。世界を変える仕事です」
咲良はその言葉を信じた。大学で認知科学を専攻し、卒業後にAI業界に入りたいと思っていた。研究者になるほどの成績ではなかったが、AIの「中身」に関われる仕事がしたかった。Prism AIのアノテーターは、その入り口になると思った。
入社して八ヶ月。咲良は毎日、画像にラベルをつけている。猫。犬。車。信号。歩行者。横断歩道。ひび割れ。腫瘍。正常。異常。
世界を変えている実感は、まだない。
Prism AIのオフィスは、渋谷のコワーキングスペースの一角にある。エンジニアチームは七人。アノテーションチームは十二人。エンジニアは全員、MacBook Proを使い、スタンディングデスクで仕事をし、SlackとFigmaとGitHubを行き来している。
アノテーションチームは、壁を挟んだ隣の部屋にいる。古いデスクトップPCが並び、専用のラベリングツールが画面を埋めている。SlackもFigmaもGitHubも使わない。使う必要がない。
壁を一枚挟んで、同じ会社に二つの世界がある。
咲良はそのことを、最初の頃は気にしなかった。自分の仕事はエンジニアとは違う。専門性が違う。役割が違う。それぞれが必要な仕事をしている。
ただ——全社会議のとき、CEOが投資家向けのプレゼンをスライドで共有したことがあった。そこには「Prism AIの技術力」として、モデルの精度、パラメータ数、処理速度が誇らしげに並んでいた。アノテーションチームへの言及は、一行もなかった。
咲良は、自分がスライドの中に存在しないことに気づいた。
ランチタイム。咲良はコンビニのおにぎりを食べながら、同僚の平野さんと話す。平野さんは三十一歳、元介護士。半年前にPrism AIに転職してきた。
「咲良ちゃん、今日のタスク何?」
「医療画像のラベリング。CTスキャンの異常検出」
「あー、それきつくない? 昨日やったけど、目がチカチカする」
「慣れました。最初の頃は気持ち悪くなったけど」
CTスキャン画像を一日中見て、「正常」と「異常」を振り分ける。医学の知識はない。マニュアルに「この形状パターンは異常」と書いてあるから、それに従う。自分の判断が正しいかどうかは、AIが学習した後の精度評価でしかわからない。
「ねえ、咲良ちゃんは、この仕事いつまで続けるつもり?」
「え?」
「だって、AIが賢くなったら、ラベリングの仕事ってなくなるんでしょ? 自分たちで自分たちの仕事をなくしてるみたいじゃない?」
咲良は笑った。「まあ、そうかもしれないけど。でも、まだ人間の判断が必要な領域はたくさんあるし——」
「それ、CTOの受け売りでしょ」
咲良は何も答えなかった。受け売りだった。
午後三時。咲良は画面の前で手を止めた。
表示された画像は、子供の顔写真だった。笑っている。三歳くらい。タスクは「感情ラベリング」——表情から感情を分類する。「happy」「sad」「angry」「neutral」「surprise」「fear」の六つのカテゴリ。
この子は「happy」だ。明らかに笑っている。でも、咲良は少し躊躇した。
この子の写真が、どこから来たのか。親の同意はあるのか。この子が大人になったとき、自分の笑顔がAIの訓練データとして使われたことを知ったら、どう思うのか。
咲良はそんなことを考えて、すぐにやめた。考え始めたら、一枚もラベルをつけられなくなる。
「happy」。クリック。次の画像。
木曜日の夜、大学時代の友人とオンラインで話した。友人は大手IT企業のデータサイエンティストとして働いている。年収は咲良の倍以上ある。
「咲良のとこ、アノテーションの仕事だっけ? それってさ、もうすぐ自動化されるんじゃない? 今のLLMがあれば、ラベリングなんて——」
「完全にはなくならないよ。エッジケースは人間じゃないと判断できないし」
「でも、九割は自動化できるでしょ。そうなったら、今のチーム、十二人もいらなくなるよね」
咲良は黙った。その可能性を、考えたことがなかったわけではない。Slackの「#general」で、エンジニアたちが「auto-labeling pipelineの精度が上がってきた」と話しているのを見たことがある。
自分がラベルをつけたデータで学習したAIが、自分のラベリング作業を自動化する。
皮肉だ、と咲良は思った。でも、皮肉だと思えているうちは、まだ余裕があるということだ。
金曜日。全社会議。CEOが興奮気味に話している。
「シリーズAの調達が決まりました。十五億円。バリュエーション八十億。投資家は僕たちの『技術力』と『データの質』を高く評価してくれました」
拍手が起きた。エンジニアたちが立ち上がって歓声を上げている。咲良も拍手した。
「データの質」。CEOの口から出たその言葉を、咲良は噛み締めた。データの質を支えているのは、咲良たちアノテーションチームだ。一枚一枚、画像を見て、判断して、ラベルをつけている。十五億円のバリュエーションの土台には、時給千二百円のラベリング作業がある。
CEOがスライドを映した。「今後のロードマップ」。その中に「アノテーション効率化:Auto-labeling v2の導入」という項目があった。
咲良は、自分がロードマップの中で「効率化される側」に位置づけられていることを、静かに理解した。
帰り道、イヤホンで音楽を聴きながら、咲良は渋谷の街を歩いた。スクランブル交差点の信号が青に変わる。人が動く。車が止まる。監視カメラが回っている。
あのカメラの映像も、いつか誰かがラベリングするのだろうか。あるいは、もう自動でラベリングされているのだろうか。咲良がラベルをつけたデータを学習したAIによって。
咲良は自分のスマホを見た。ロック画面の壁紙は、自分で撮った夕焼けの写真だ。この写真も、どこかのサーバーにアップロードされて、いつかAIの訓練データになるかもしれない。ならないかもしれない。咲良にはわからない。
月曜日。咲良はまた画面の前に座る。今日のタスクは、自動運転用の道路画像ラベリング。車線。標識。歩行者。障害物。一枚一枚、正確にラベルをつける。
この仕事に意味がある、と咲良は思う。AIを賢くしている。世界を変える仕事だ。
そう思い続けることが、咲良がこの椅子に座り続けるための条件だった。
(第7話「ピボット」へ続く)