我的學習群裡全是真大佬第213章

作者：胖胖的小橘

　　華軒：？？？

　　或者說……

　　這小子心裡裝的東西，比錢大得多。

　　李總沉默了大概兩秒鐘。

　　然後擺了擺手，笑著說道。

　　“行，不勉強你。”

　　“我就是惜才。”

　　“以後你要是改主意了，隨時給我打電話。”

　　高穩這個時候才慢悠悠地插了一句。

　　“行了李總，你也別老盯著我們家這棵苗子。”

　　“田鋼院士那邊可看著呢，你再這麼挖下去，老田明天就得給我打電話。”

　　李總立馬“哎喲”一聲，做出一個誇張的告饒手勢。

　　“不敢不敢，田院士的人，我哪敢動。”

　　三個人相視一笑。

　　桌上的氣氛一下子就緩和下來了。

　　……

　　六點半的時候，晚宴正式開始了。

　　服務員推著餐車從門口的側門進來。

　　宴會廳一共就兩桌，李東、高穩、李總坐在主桌。

　　旁邊幾個也是比較有分量的人。

　　包括裡雲那位副總裁，還有一個看起來像是某家做晶片的初創公司CEO的男人，也都坐在主桌上。

　　服務員退出去之後，話題自然而然就從最近的天氣、最近的政策，慢慢地飄到了“那玩意兒”上面。

　　“那玩意兒”

　　這是在場所有人對“GPT-3.5”心照不宣的稱呼。

　　最先開口的是裡雲AI那位副總裁，姓邱，叫邱明麗。

　　她端著酒杯，慢悠悠地說道。

　　“上個禮拜我們組裡專門搞了一個內部測試。”

　　“中文常識題、英文閱讀理解、程式碼生成、數學推理、長文字總結，五個方向，各出了二十道題。”

　　她嘆了口氣。

　　“五個方向，它都贏了。”

　　桌上一片沉默。

　　李總放下了筷子，眉頭皺著。

　　“贏得多嗎？”

　　邱明麗自嘲的笑了一聲。

　　“我就不說具體分數了，但差距……不小。”

　　“尤其是那種需要多步推理的題，我們這邊的模型基本上做到第三步就開始胡言亂語了。”

　　“它還能穩穩地往下推。”

　　“你把一道國內高考壓軸題扔給它，它就算做錯，它做錯的路子也是對的。”

　　“它是在認真地算錯，不是那種一看就知道在瞎編的錯。”

　　“這個東西，是我們目前的模型最缺的。”

　　那個戴眼鏡的男人放下了刀叉，慢慢地開口。

　　“邱總，我其實一直有個問題想請教。”

　　“GPT-3到GPT-3.5中間這一跳，到底關鍵是跳在哪兒的？”

　　“外面現在一提就是RLHF，好像那一套人類反饋就是所有答案。”

　　“但我總覺得沒那麼簡單。”

　　邱明麗笑了一下。

　　“你這個問題，問到點子上了。”

　　“RLHF這幾個字，最近被炒得有點太兇了。”

　　他用筷子頭在桌布上虛劃了一下。

　　“GPT-3到GPT-3.5，真正那一跳，不是RLHF。”

　　“是程式碼。”

　　桌上有人愣了一下。

　　“程式碼？”

　　邱明麗點頭。

　　“OpenAI中間悄悄幹了一件事。”

　　“他們在GPT-3的底座上，又灌了一輪超大規模的程式碼預訓練，內部叫-davinci-002。”

　　“GitHub上能扒的高質量程式碼，加上一部分自然語言和程式碼混在一起的資料，一鍋燉進去。”

　　“灌完這一輪出來，模型的推理能力莫名其妙地就起來了。”

　　“不光是會寫程式碼了，你讓它做數學題、讓它做多步邏輯推理、讓它分析一段很長的論證，它突然就會想了。”

　　“業內現在把這個叫做程式碼帶出來的思維鏈。”

　　“程式碼這個東西是很嚴苛的，你少一個分號它就跑不了。”

　　“模型在海量程式碼上被反覆蹂躪過一遍之後，它對一步一步地把事情想清楚這件事，就有了一種別的語料給不了的感覺。”

　　邱明麗頓了一下，抿了一口酒。

　　“在這個底座上，再往上套指令微調、再往上套RLHF那才有了ChatGPT。”

　　“但你要問跳在哪兒，我也只是個人猜測，最關鍵的一跳我覺得的是在程式碼預訓練那一步。”

　　“RLHF真正解決的問題，是怎麼讓這個聰明但是野的模型聽人話。”

　　“它解決的是對齊，不是智商。”

　　那個戴眼鏡的男人慢慢地點頭，若有所思。

　　邱明麗接著補了一句。

　　“當然RLHF那一套也不是簡單東西。”

　　“我們這邊要追這一套，標註員的培訓體系從零開始搭，至少得半年到一年才能進入狀態。”

　　桌上一片安靜。

　　李總端起杯子，輕輕晃了一下。

　　“我補一句。”

　　“我們家文心這邊，其實也不是從今年才開始搞的。”

　　“ERNIE3.0Titan兩年前就發了，2600億引數，中文那些經典榜單上咱們也不虛GPT-3。”

　　“真要說單純的中文語言理解，我們底子不差。”

　　李東一直沒有說話，但是他聽的很認真。

　　李總繼續說道。

　　“但這次3.5一出來，我自己心裡涼了一下。”

　　“涼不是涼在它中文比我們好，它中文其實還沒我們好。”

　　“主要是……它和我們根本不是在做同一件事。”

　　“我們之前那一代大模型，比的是這個句子的意思你理解得準不準、你分類的對不對、你完形填空填得好不好。”

　　“它比的是你能不能和人自然地聊天，聊的時候順手把一道題給做了、把一段程式碼給寫了。”

　　“後面這件事，是另一個維度上的能力。”

　　“不是我們原來那一套路線自然延伸能接上的。”

　　“我們內部這兩個月已經在趕下一版了。”

　　“對外的代號你們可能過一陣子就會聽到，這次我們是對著3.5去的。”

　　“但我跟你們交個底。”

　　“第一版出來的東西，和3.5之間，差距肯定還會有。”

　　“而且還不是那種一個月兩個月就能抹平的差距。”

　　氣氛沉了一會兒，邱明麗突然看向李東。

　　笑著開口。

　　“這位小兄弟一直沒說話啊。”

　　“還挺面生的。”

第216章原來你也只是個會做白日夢的小孩

　　李東禮貌的把筷子放了下來。

　　“邱總您好，我是高老師的學生，李東。”

　　邱明麗愣了一下。

　　然後就有些驚喜的說道。

　　“你就是李東？”

　　“那個降維演算法的李東？”

　　“我的天，你這也太年輕了吧。”

　　旁邊幾個原本沒對上號的，聽見“降維演算法”這四個字，也反應了過來，紛紛看向李東。

　　李東被這麼多雙眼睛盯著，多少有點不自在。

　　“邱總過獎了，我就是個大學生。”

　　“我就瞎搞的。”

　　李總在旁邊哈哈大笑。

　　“瞎搞？你這要是瞎搞，那我們這幫人全都白乾了。”

　　桌上一片善意的笑聲。

　　笑聲落下之後，邱明麗率先說道。

　　“李東啊，我特別想聽聽你的看法。”

　　“你看剛才咱們聊的，算力、資料……這些東西”

　　“那你心裡對‘怎麼追上去’這件事，有沒有什麼想法？”

　　說實話在座的人是真的想聽，畢竟李東演算法的去向他們不知道，不知道本身就很說明問題了。

　　所以他們對李東是特別的好奇的。

　　李東沉默了幾秒鐘。

　　老實講，他心裡其實並沒有什麼完整的能拿出來講的想法。

　　他只是……

上一篇：我家艺人太没上进心了

下一篇：返回列表

我的學習群裡全是真大佬 第213章

推薦閱讀!

我的學習群裡全是真大佬第213章