我的學習群裡全是真大佬 第213章

作者:胖胖的小橘

  華軒:???

  或者說……

  這小子心裡裝的東西,比錢大得多。

  李總沉默了大概兩秒鐘。

  然後擺了擺手,笑著說道。

  “行,不勉強你。”

  “我就是惜才。”

  “以後你要是改主意了,隨時給我打電話。”

  高穩這個時候才慢悠悠地插了一句。

  “行了李總,你也別老盯著我們家這棵苗子。”

  “田鋼院士那邊可看著呢,你再這麼挖下去,老田明天就得給我打電話。”

  李總立馬“哎喲”一聲,做出一個誇張的告饒手勢。

  “不敢不敢,田院士的人,我哪敢動。”

  三個人相視一笑。

  桌上的氣氛一下子就緩和下來了。

  ……

  六點半的時候,晚宴正式開始了。

  服務員推著餐車從門口的側門進來。

  宴會廳一共就兩桌,李東、高穩、李總坐在主桌。

  旁邊幾個也是比較有分量的人。

  包括裡雲那位副總裁,還有一個看起來像是某家做晶片的初創公司CEO的男人,也都坐在主桌上。

  服務員退出去之後,話題自然而然就從最近的天氣、最近的政策,慢慢地飄到了“那玩意兒”上面。

  “那玩意兒”

  這是在場所有人對“GPT-3.5”心照不宣的稱呼。

  最先開口的是裡雲AI那位副總裁,姓邱,叫邱明麗。

  她端著酒杯,慢悠悠地說道。

  “上個禮拜我們組裡專門搞了一個內部測試。”

  “中文常識題、英文閱讀理解、程式碼生成、數學推理、長文字總結,五個方向,各出了二十道題。”

  她嘆了口氣。

  “五個方向,它都贏了。”

  桌上一片沉默。

  李總放下了筷子,眉頭皺著。

  “贏得多嗎?”

  邱明麗自嘲的笑了一聲。

  “我就不說具體分數了,但差距……不小。”

  “尤其是那種需要多步推理的題,我們這邊的模型基本上做到第三步就開始胡言亂語了。”

  “它還能穩穩地往下推。”

  “你把一道國內高考壓軸題扔給它,它就算做錯,它做錯的路子也是對的。”

  “它是在認真地算錯,不是那種一看就知道在瞎編的錯。”

  “這個東西,是我們目前的模型最缺的。”

  那個戴眼鏡的男人放下了刀叉,慢慢地開口。

  “邱總,我其實一直有個問題想請教。”

  “GPT-3到GPT-3.5中間這一跳,到底關鍵是跳在哪兒的?”

  “外面現在一提就是RLHF,好像那一套人類反饋就是所有答案。”

  “但我總覺得沒那麼簡單。”

  邱明麗笑了一下。

  “你這個問題,問到點子上了。”

  “RLHF這幾個字,最近被炒得有點太兇了。”

  他用筷子頭在桌布上虛劃了一下。

  “GPT-3到GPT-3.5,真正那一跳,不是RLHF。”

  “是程式碼。”

  桌上有人愣了一下。

  “程式碼?”

  邱明麗點頭。

  “OpenAI中間悄悄幹了一件事。”

  “他們在GPT-3的底座上,又灌了一輪超大規模的程式碼預訓練,內部叫-davinci-002。”

  “GitHub上能扒的高質量程式碼,加上一部分自然語言和程式碼混在一起的資料,一鍋燉進去。”

  “灌完這一輪出來,模型的推理能力莫名其妙地就起來了。”

  “不光是會寫程式碼了,你讓它做數學題、讓它做多步邏輯推理、讓它分析一段很長的論證,它突然就會想了。”

  “業內現在把這個叫做程式碼帶出來的思維鏈。”

  “程式碼這個東西是很嚴苛的,你少一個分號它就跑不了。”

  “模型在海量程式碼上被反覆蹂躪過一遍之後,它對一步一步地把事情想清楚這件事,就有了一種別的語料給不了的感覺。”

  邱明麗頓了一下,抿了一口酒。

  “在這個底座上,再往上套指令微調、再往上套RLHF那才有了ChatGPT。”

  “但你要問跳在哪兒,我也只是個人猜測,最關鍵的一跳我覺得的是在程式碼預訓練那一步。”

  “RLHF真正解決的問題,是怎麼讓這個聰明但是野的模型聽人話。”

  “它解決的是對齊,不是智商。”

  那個戴眼鏡的男人慢慢地點頭,若有所思。

  邱明麗接著補了一句。

  “當然RLHF那一套也不是簡單東西。”

  “我們這邊要追這一套,標註員的培訓體系從零開始搭,至少得半年到一年才能進入狀態。”

  桌上一片安靜。

  李總端起杯子,輕輕晃了一下。

  “我補一句。”

  “我們家文心這邊,其實也不是從今年才開始搞的。”

  “ERNIE3.0Titan兩年前就發了,2600億引數,中文那些經典榜單上咱們也不虛GPT-3。”

  “真要說單純的中文語言理解,我們底子不差。”

  李東一直沒有說話,但是他聽的很認真。

  李總繼續說道。

  “但這次3.5一出來,我自己心裡涼了一下。”

  “涼不是涼在它中文比我們好,它中文其實還沒我們好。”

  “主要是……它和我們根本不是在做同一件事。”

  “我們之前那一代大模型,比的是這個句子的意思你理解得準不準、你分類的對不對、你完形填空填得好不好。”

  “它比的是你能不能和人自然地聊天,聊的時候順手把一道題給做了、把一段程式碼給寫了。”

  “後面這件事,是另一個維度上的能力。”

  “不是我們原來那一套路線自然延伸能接上的。”

  “我們內部這兩個月已經在趕下一版了。”

  “對外的代號你們可能過一陣子就會聽到,這次我們是對著3.5去的。”

  “但我跟你們交個底。”

  “第一版出來的東西,和3.5之間,差距肯定還會有。”

  “而且還不是那種一個月兩個月就能抹平的差距。”

  氣氛沉了一會兒,邱明麗突然看向李東。

  笑著開口。

  “這位小兄弟一直沒說話啊。”

  “還挺面生的。”

第216章 原來你也只是個會做白日夢的小孩

  李東禮貌的把筷子放了下來。

  “邱總您好,我是高老師的學生,李東。”

  邱明麗愣了一下。

  然後就有些驚喜的說道。

  “你就是李東?”

  “那個降維演算法的李東?”

  “我的天,你這也太年輕了吧。”

  旁邊幾個原本沒對上號的,聽見“降維演算法”這四個字,也反應了過來,紛紛看向李東。

  李東被這麼多雙眼睛盯著,多少有點不自在。

  “邱總過獎了,我就是個大學生。”

  “我就瞎搞的。”

  李總在旁邊哈哈大笑。

  “瞎搞?你這要是瞎搞,那我們這幫人全都白乾了。”

  桌上一片善意的笑聲。

  笑聲落下之後,邱明麗率先說道。

  “李東啊,我特別想聽聽你的看法。”

  “你看剛才咱們聊的,算力、資料……這些東西”

  “那你心裡對‘怎麼追上去’這件事,有沒有什麼想法?”

  說實話在座的人是真的想聽,畢竟李東演算法的去向他們不知道,不知道本身就很說明問題了。

  所以他們對李東是特別的好奇的。

  李東沉默了幾秒鐘。

  老實講,他心裡其實並沒有什麼完整的能拿出來講的想法。

  他只是……