程序員最?lèi)?ài)的問(wèn)答網(wǎng)站,給ChatGPT當起了“奶媽”
打不過(guò),就加入。
Stack Overflow,一個(gè)類(lèi)似知乎、Reddit的老牌網(wǎng)站,因專(zhuān)注于技術(shù)問(wèn)答和社區運營(yíng),因此在全球程序員圈內備受歡迎。
然而自從ChatGPT問(wèn)世以來(lái),該網(wǎng)站的訪(fǎng)問(wèn)量和搜索量都在短時(shí)間里驟降,眾多程序員開(kāi)始放棄使用。
為了挽留住用戶(hù),Stack Overflow先是封殺ChatGPT,緊接著(zhù)推出自研AIGC產(chǎn)品,但接二連三的“自救”依然止不住流量的大幅下降。
令人驚訝的是,Stack Overflow突然在本周一宣布與OpenAI簽訂協(xié)議,為其提供數據。
有意思的是,Stack Overflow不僅與OpenAI合作,其豐富的數據也被谷歌的Gemini模型買(mǎi)走。
程序員最大的問(wèn)答網(wǎng)站,擋不住AI
在程序員圈里,Stack Overflow地位有多高?
簡(jiǎn)單點(diǎn)說(shuō),作為一家老牌問(wèn)答網(wǎng)站,Stack Overflow已經(jīng)成立了16年、最高時(shí)每月都有2億臺主機訪(fǎng)問(wèn)。
無(wú)論一線(xiàn)大廠(chǎng)技術(shù)大佬,還是剛入門(mén)的計算機小白,只要提出了編程問(wèn)題,總會(huì )有網(wǎng)友挺身而出,提供思路,甚至直接給出最優(yōu)解的答案。
正是因為有著(zhù)龐大的數據,Stack Overflow雖然名氣比不上Reddit,但也算是圈內人的必備網(wǎng)站。
但事情在ChatGPT橫空出世后,開(kāi)始朝著(zhù)衰落的方向發(fā)展。
在 ChatGPT上線(xiàn)后,迅速有網(wǎng)友發(fā)現其出色的代碼生成能力,因此“ChatGPT可以取代Google、Stack Overflow”的言論吸引了大批程序員的目光。
然而令人沒(méi)想到的是,僅僅上線(xiàn)5天后,Stack Overflow反手就把 ChatGPT 給封殺了。
原因是ChatGPT生成的代碼錯得過(guò)于離譜,因此Stack Overflow宣布這些生成垃圾答案的賬號都會(huì )被封號。
有意思的是,Stack Overflow團隊發(fā)現,很多用來(lái)訓練AI模型的數據,其實(shí)就是來(lái)自Stack Overflow。
如果放任AI機器人生成垃圾回答,那不就等于搬起石頭砸自己的腳嗎?
雖然Stack Overflow的表態(tài)很明確,廣大程序員們也能理解,但奈何ChatGPT的體驗實(shí)在是真香!
最終,面對AI的強勢來(lái)襲,Stack Overflow的流量也是越來(lái)越差,到了2023年6月,瀏覽量幾乎已經(jīng)是腰斬。
為了止住頹勢,Stack Overflow 開(kāi)始是一系列措施。
先是在7月,技術(shù)團隊利用自家5800萬(wàn)個(gè)問(wèn)題和答案的數據庫,做了一款名為「OverflowAI」的AI 工具,其功能主要圍繞著(zhù)編程,但沒(méi)有掀起太大的水花。
到了10月,公司CEO宣布解雇了約28%的員工,通過(guò)縮減營(yíng)銷(xiāo)預算的方式,為 AI工具持續輸血。
不過(guò)由于OverflowAI還處于初級測試階段,面對實(shí)力強勁且不斷進(jìn)化的ChatGPT,OverflowAI能做的僅僅是拖延Stack Overflow衰落的速度。
賣(mài)數據,真香
在面對ChatGPT的威脅時(shí),Stack Overflow一開(kāi)始選擇使用“防御”的姿態(tài)。
但殊不知,這些公開(kāi)的互聯(lián)網(wǎng)數據早已被OpenAI等科技公司用“爬蟲(chóng)”等手段進(jìn)行搜刮,自己不僅要面臨用戶(hù)的流失,更要面臨數據的流失。
不過(guò)畢竟日訪(fǎng)問(wèn)量擺在那里,Stack Overflow手握著(zhù)大量?jì)?yōu)質(zhì)的數據,倒也成為一筆可以交易的資源。
自《紐約時(shí)報》帶頭起訴OpenAI后,越來(lái)越多的新聞媒體和門(mén)戶(hù)網(wǎng)站加入到討伐OpenAI的隊伍中。
在面對版權問(wèn)題時(shí),科技公司們只能乖乖掏錢(qián)為訓練數據付費,并承諾不會(huì )使用私人數據。
Reddit、Youtube、ShutterStock、Photobucket等網(wǎng)站都是數據交易的受益者,手握大把優(yōu)質(zhì)的訓練材料,科技巨頭們花起錢(qián)來(lái)也是毫不吝嗇。
相比之下,Stack Overflow的數據同樣出色,甚至比Reddit這樣的綜合性網(wǎng)站更加專(zhuān)業(yè)。
因此,Stack Overflow CEO也開(kāi)始學(xué)會(huì )了向各大科技公司推銷(xiāo)自家數據,其中就包括了Google的 Gemini 模型。
或許正是看到了科技公司對于優(yōu)質(zhì)數據的渴望,讓高層選擇來(lái)了一次360度的態(tài)度大轉變,既然用戶(hù)是回不來(lái)了,那至少把錢(qián)賺到口袋里。
值得一提的是,Stack Overflow當時(shí)強調,該協(xié)議并不具有排他性,這就意味著(zhù)任何科技公司都可以購買(mǎi)同樣的數據,剩下就看哪家訓練得更好。
據報道稱(chēng),Stack Overflow 的技術(shù)內容將與 OpenAI 的 GPT-4 等模型相結合,通過(guò)OverflowAPI訪(fǎng)問(wèn),未來(lái)開(kāi)發(fā)者可以直接通過(guò) OpenAI獲得可靠且經(jīng)過(guò)驗證的數據,并幫助他們快速找到解決復雜問(wèn)題的方法。
而Stack Overflow 也能從開(kāi)發(fā)社區收集反饋,確保 AI 開(kāi)發(fā)工具持續改進(jìn)。
簡(jiǎn)單點(diǎn)就是說(shuō),Stack Overflow與 OpenAI來(lái)了一次技術(shù)和數據的互換,前者提高了AI能力,后者得到了可靠的數據,兩者雙贏(yíng)。
據悉,此次合作將帶來(lái)的第一組集成功能和能力,預計將于 2024 年上半年發(fā)布,這也說(shuō)明雙方的合作其實(shí)已經(jīng)進(jìn)行了很久。
隱私還是大問(wèn)題?
目前,越來(lái)越多的社區網(wǎng)站開(kāi)始加入到AI訓練中,包括百度貼吧的“弱智吧”,在一次研究里顯現出不俗的數據訓練效果,一度沖上熱搜。
對于訪(fǎng)問(wèn)量不斷下降的傳統內容網(wǎng)站們,優(yōu)質(zhì)的數據確實(shí)是一個(gè)可以長(cháng)期進(jìn)行的“副業(yè)”。
另外,AI固然很香,但不是沒(méi)有缺點(diǎn)。
自Stack Overflow開(kāi)始轉向開(kāi)發(fā)AI能力后,開(kāi)發(fā)者社區的一些成員對這一變化表示反對,他們對人工智能生成的信息的有效性、以及數據隱私表示擔憂(yōu)。
也有專(zhuān)家指出,AI會(huì )導致更多錯誤代碼被推送到代碼庫中,甚至放大軟件項目中現有的漏洞和安全問(wèn)題。
但對于“饑渴”的AI公司們,不斷膨脹的數據消耗問(wèn)題已經(jīng)足夠頭疼。
而網(wǎng)站的幫助,剛好可以為自己分擔一些風(fēng)險。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
