JSTORIES與進行革新性工作、日本初創企業的知名播客節目[Disrupting JAPAN]進行了內容合作,並開始以日語介紹該節目發佈的有趣集數。以下介紹的是對Integral AI(インテグラルAI)創辦人、並在AI開發領域走在最前沿的ジャド・タリフィ(Jad Tarifi)先生的訪談,我們將分四篇文章進行介紹。
*這次的訪談於2025年1月發佈。
本集(英文版播客)可以在這裡收聽。


***
日本在AI(人工智能)領域被認為落後於其他國家,但這種情況可能不會持續太久。
此次的嘉賓是目前Integral AI(インテグラルAI)創辦人、並且曾經負責Google的首代生成AI(即學習數據並創造新內容的技術)團隊的ジャド・タリフィ(Jad Tarifi)先生。
在對話中,我們探討了日本在AI領域所擁有的優勢與潛力、AGI(人工通用智能)的最有力發展路徑,以及如何讓小型AI初創公司在資金實力強大的大型AI企業面前脫穎而出。
這是一個非常有趣的內容,希望您會喜歡!
※AGI(人工通用智能,Artificial General Intelligence)指的是具備像人類一樣的廣泛知識,能夠應對各種挑戰的人工智能。目前的AI專注於特定領域,例如圖像識別或文本生成,並在這些領域表現出色。而AGI預期將是一種單一AI系統,具備處理多種智力工作能力的技術。
(這是四集中的第二集,從第一集的內容繼續。)
***
本編
東京作為基地的優勢是什麼?

蒂姆:關於AGI的話題我們稍後再討論,尤其是與機器人技術的關係,我們稍後會深入了解。在那之前,我想問您一個關於貴公司組織結構的問題。Integral AI的總部設在舊金山,但在東京也有辦公室,對吧?現在我們正在東京的辦公室進行對話,我聽說工程師團隊也在這裡。
許多企業都表示「日本缺乏優秀的工程師」,因此他們會去像舊金山這樣的地方尋找人才,而貴公司卻在日本取得了成果。您認為其他初創公司可能忽略的,您們所看見的關鍵是什麼呢?
塔里菲:首先,確實,舊金山灣區(以舊金山為中心的IT和初創企業集聚地)有很多優秀的AI研究者,但美國的機器人技術產業本身仍然沒有得到充分發展。相比之下,日本是全球工業機器人約一半的生產地,並且在機器人領域擁有強大的生態系統,東京就是這樣的中心。因此,我認為將AI的中心地舊金山灣區與機器人技術的中心地東京結合,是理想的選擇。
這最終證明是一個非常好的決策。事實上,日本有很多仍未被充分認可的優秀工程師。當然,語言障礙確實存在。為此,我們建立了一個支持體系,幫助年輕且有才華的工程師適應英語環境,並能夠自信地工作。根據我的經驗,大約需要3到6個月的時間來習慣英語環境,但只要提供適當的支持,每個人都能順利適應。

多元視角的重要性:人才挖掘
塔里菲:還有一個要點是,我們並不是研究機構,而是一家擁有明確願景,致力於產品開發的公司。因此,我們並不需要許多經驗豐富的資深研究員。反而在目前的階段,充滿活力、誠實且重視團隊合作的年輕工程師,比擁有行業經驗的工程師更加具有價值。
蒂姆:那麼,對於那些認為必須前往舊金山灣區才能找到優秀人才的初創公司創辦人,您有什麼建議嗎?
塔里菲:我認為保持開放的心態非常重要。雖然「去灣區」這個想法聽起來很有吸引力,但實際上,我所認識的許多灣區的企業家都說,「這裡的成本實在太高了。」人才流動性也非常高,即使你花了好幾個月聘用並培訓新人,往往也會發現他們很快就跳槽去別的公司。
從更寬廣的角度來看,AGI的發展需要多元的視角和意見。這不是應該只由某個特定地方,或某種單一的價值觀和文化來推動的。因此,我認為讓世界各地的創新和想法能夠相互交流,才是至關重要的。
為什麼在機器人技術領域成功經營一個商業是那麼困難?
蒂姆:您提到過,日本在傳統的機器人領域非常強大,但即便如此,機器人技術依然是一個難度極高的領域。事實上,很多初創公司都失敗了。甚至可以說,幾乎所有的機器人相關初創公司都未能成功。為什麼在機器人領域成功經營一個商業這麼困難呢?
塔里菲:這真的是一個非常好的問題。老實說,我認為僅僅討論這個話題,就足以用整場訪談來探討了。首先,機器人領域的初創公司常常會被技術的複雜性所壓倒。需要解決的問題太多了,這樣就會讓公司將目標過於集中,「我們只做這一款產品」,這樣限制了他們的發展。
舉個例子,如果決定要「用機器人來自動化拣貨作業」,那麼公司就會和機器人臂的製造商合作,進一步和系統集成商(將多種設備或軟件整合為一個系統的公司或技術人員)合作,最終將這個系統推向市場銷售……這樣的流程中,涉及的參與者太多,結果是沒有人對整個產品負責。這樣一來,產品的改進速度就會被拖慢。換句話說,如果沒有人能夠掌握整體情況,事情就無法順利推進。
蒂姆:也就是說,將產品或服務迅速推向市場是非常困難的。
塔里菲:沒錯。
蒂姆:這意味著,相關方之間達成共識需要花費太多時間。
塔里菲:正是如此。最終,對於一家需要快速行動的初創公司來說,這種結構本身成為了很大的障礙。而如果希望完全掌控整個產品,就需要極高的技術能力和大量的資源。然而,這些資源並不是普通的初創公司能輕易擁有的。
機器人導入的挑戰與經濟性困境
蒂姆:但在這一點上,我想提出一些反駁。比如,看一下波士頓動力(美國的機器人開發公司)這樣的公司。他們擁有足夠的技術實力、資金以及豐富的資源,似乎資金源源不斷。但即便如此,將真正的產品推向市場仍然不容易。雖然他們確實有一些銷售成績,但大多數都是限於小範圍的企業試點(即所謂的試點計劃),儘管他們擁有強大的技術實力,卻很難稱得上是「成功的機器人初創公司」。
塔里菲:其實,在這方面我有些不同的看法。我認為,他們的技術是否“出色”這一點值得討論。因為他們主要使用的是傳統的控制理論技術,這種方法有一個挑戰,就是不容易進行大規模的擴展。他們自己也意識到了這一限制,並且現在正在進行方向調整。儘管如此,他們的演示視頻確實非常引人入勝,印象深刻,並且吸引了大量人群的注意。
不過,您的觀點非常重要,這也正是我接下來想要談論的內容,即「機器人導入這類自動化手段,究竟能在多大程度上被接受並成為吸引人的選擇」。
舉個例子,讓我們來看一下中國的工廠如何組裝智能手機。在現實中,企業面臨的選擇是,要么導入機器人,要么以每年約1萬美元的薪水雇用員工。而且,僅僅是機器人的零件成本就可能超過1萬美元,這樣從經濟性角度來看,雇人似乎是一個更具成本效益的選擇。基於這樣的背景,想要讓企業引入機器人,進行「客戶獲取」就變得非常困難。
機器人領域初創公司的挑戰與AI解決的可能性
塔里菲:還有一個難題,就是導入的周期非常長。例如,當我們與日本的大型企業洽談時,常常聽到他們說「我們正在計劃新工廠」。當我們問他們「預計何時開始生產?」時,常常會收到「2032年」這樣的回應,這並不罕見。
蒂姆:一旦建立了生產線(將工作流程機械化的系統),每年都進行更改顯然不現實。
塔里菲:沒錯。事實上,這個領域更像是建築業,而不是技術業務。而且,機器人技術初創公司失敗的第三個原因就是,技術還沒有完全成熟。過去,每個場景都需要不同的技術,必須組建專門的技術團隊,並針對每個問題單獨制定解決方案。這樣一來,整體系統的成本就變得非常高。然而,隨著生成AI和AGI的進步,未來將出現能夠解決多種問題的單一解決方案,並且成本將會大幅降低。

機器人技術的數據利用與汎用性的提升
蒂姆:機器人技術的訓練數據(AI學習的基礎數據)能夠在多大程度上被汎用化使用呢?例如,如果我們有來自汽車工廠機器人的數據、波士頓動力開發的「阿特拉斯」機器人數據,以及用來製作和提供咖啡的機器人數據,那麼這些來自不同領域的數據可以在其他領域中得到利用嗎?
塔里菲:這真是一個非常好的問題,也是經常被誤解的地方。矽谷的投資者認為,機器人技術難度大的一個原因是數據不足。因此,他們認為每個機器人必須根據其運行場所或目的來收集專門的數據。的確,數據不足確實是其中的一個原因。舉個例子來說,支持人類的機器人,如果統一機器人的形狀,那麼收集數據會變得更容易。
然而,實際上,人類的學習方法大多是通過觀察其他人做什麼來學習的。我們的研究發現,如果我們讓AI能夠理解世界,這樣訓練出來的AI模型可以應用到不同形狀的機器人上。當然,要使新機器人適應這些模型,可能需要進行一些調整,但這就像是去健身房前的熱身一樣。事實上,進行這種熱身後,AI模型會變得更加汎用,能夠更靈活地適應新的挑戰。換句話說,如果我們用10種不同的機器人進行訓練,那麼第11個機器人所需的適應會變得容易得多。我們認為,未來會有大量不同類型的機器人出現,就像「寒武紀大爆發」一樣,這是指大約5億4000萬年前,生物的多樣性和數量急劇增加的現象,未來也將有各種機器人應對各種多樣化的任務。
AI初創公司如何與大企業競爭
蒂姆:了解了,這正是機器學習(AI從數據中學習模式並進行預測和決策)應該解決的一個領域。那麼,我想擴大一下視角,詢問有關AI初創公司的問題。目前,像OpenAI、Anthropic、Meta這樣的美國大型企業已經開發了基礎的模型,而這些企業擁有無限的資金和優秀的人才。假設不涉及硬體領域,純粹在軟體領域,小規模的AI初創公司如何與這些企業競爭?您認為目前應該遵循哪些商業模式?
塔里菲:是的,這確實是一個值得探討的問題。我認為這個問題可以分為幾個不同的部分來回答。首先,我會談談如何與大企業競爭,然後再談談商業模式。
僅僅訓練一個像轉換器模型(理解文本語境並生成自然語言的AI技術)這樣的模型,老實說,競爭非常艱難。因為這是每個人都可以做到的事情。然而,如果能在架構(系統結構與設計)和算法(計算步驟與思維方式)方面實現技術上的差異化,那麼就有可能脫穎而出。當然,僅僅這樣還是不夠的,因為最終無論什麼技術,都會被複製。
那麼,初創公司的優勢在哪裡呢?就是能夠迅速做出決策,並且迅速進行試錯。尤其是在新平台出現的時候(即服務基礎環境或系統發生變化的時候),這種能力至關重要。當平台發生變化時,新的機會也會隨之而來。而能夠最早探索這些未開發領域的公司,最終將成為獲勝者。
初創公司中出現的機會
蒂姆:那麼,具體來說,有哪些領域或案例是值得關注的呢?我看過許多AI初創公司,大多數公司在初期我會覺得「這是一個有趣的點子」,但當市場變得足夠大時,一旦大企業稍微調整方向,這些市場就會被它們搶走。
塔里菲:關鍵不在於僅僅添加一些功能,而是「整個平台的變革」。目前正在進行中的一個平台變革的例子是LLM(大型語言模型)的普及,像OpenAI就是一個代表。OpenAI在數據、人才、資金等方面的資源,比起Google要少得多。然而,現在Google正面臨著來自OpenAI的激烈競爭。這並不是第一次發生過類似的情況。曾經,Google也在類似的情況下擊敗了Microsoft。當新平台出現時,初創公司就會迎來機會。
突破口となる新技術の開発
塔里菲:還有一個重要的點是,能否建立強大的競爭優勢,所謂的「護城河(競爭中的防壁)」。特別是在物理世界中,隨著數據的積累,會形成很大的優勢。比如,擁有能夠持續學習的AI模型,就可以在利用現有數據的基礎上持續進化。目前使用的許多生成AI,在訓練完模型並學習結束後,它們就會進入推理模式(基於預先學習的內容進行運作),這使得它們無法吸收新的信息。
我們公司開發了一項突破性的技術,使得AI能夠持續學習。我們的AI模型能夠在不忘記過去學習的內容的情況下,持續添加新的數據和經驗。神經網絡(構成AI系統的、像神經回路一樣的結構)存在「災難性遺忘」問題,這是指在學習新信息的過程中,會忘記之前學過的內容,但我們已經有效地解決了這一問題。這樣一來,隨著數據的積累,AI的性能不僅能提高,還會促使更多的學習,從而產生強大的網絡效應,進一步強化競爭優勢。
企業的成功與技術價值的區分
蒂姆:那麼,從相反的角度來問,您認為構建基礎的AI模型真的有價值嗎?當我們比較像ChatGPT、Llama(拉馬)、Claude(克勞德)等多個生成AI模型時,它們各自有特點,但性能上並沒有太大區別。而且,它們都是基於Google開發的Transformer模型,而這項技術本身是公開的,任何人都能夠使用,因此很難說它在知識產權上具有強大的獨佔價值。儘管如此,OpenAI的企業估值已經達到1570億美元,而由OpenAI的前高層創立的初創公司Safe Superintelligence(SSI)在創立初期就籌集了10億美元的資金。這些企業的評價能夠在長期內得到合理化嗎?在技術公開的情況下,其他公司也能提供類似的產品,那麼這些公司能在未來維持這樣的評價嗎?
塔里菲:首先,我認為將一個企業的成功與技術本身的價值區分開來非常重要。這些技術無疑擁有改變世界的潛力,如果某家公司能夠成功地擴展業務,那麼它的投資將會帶來充分的回報,並為投資者和整個行業帶來合理的結果。但是,如果問我「從零開始構建基礎模型真的有價值嗎?」我會回答「不」!最大的優勢最多也不過是「先行者優勢」。我們的技術並非基於Transformer模型,而是全新架構,但僅此而已,我們認為這還不足以成為競爭優勢。關鍵是要建立好商業機制,並與實際使用我們技術的人群建立強大的關係。
生成AI的未來
蒂姆:這正是我認為非常現實的情景。雖然這可能是完全不同的話題,但我不禁想起1990年代末到2000年代初的太陽能行業。當時,巨額資金被投入,其中許多公司倒閉。然而,技術本身穩步進步,現在已經對世界帶來了巨大的變革。也許在生成AI領域,會發生類似的事情。也就是說,技術本身將繼續改變社會,但20年後,投資者回顧今天的情況時,可能會認為當時投入的資金並不一定是正確的選擇。
塔里菲:我同意這個觀點。大多數公司將會消失。然而,從整體來看,這並不那麼重要,因為社會性的利益將會確保留下來。而從投資者的角度來看,仍然會有一些公司存活下來,這些公司值得投資。
(第三回將繼續)
第三回中,塔里菲將會討論AGI的定義、意圖、意識自覺以及它如何進化的問題。
[本內容由東京為基地的初創公司播客《Disrupting JAPAN》合作提供。請參閱《Disrupting JAPAN》網站了解更多。]
翻譯:藤川華子
編輯:一色崇典
頂部圖片:Envato
***
本文章的英文版可以從這裡查看。