人工智能從業者:大牛,工程師和調參狗

3 評論 8580 瀏覽 13 收藏 7 分鐘

你眼中的他和他眼中的他是不是同一個人。

今天準備來點兒干貨。

你要問這兩天什么火,每個產品經理都會告訴你人工智能和區塊鏈。很多人都還沒搞明白這些東西是什么,能解決啥問題,就已經懷著一身熱情撲了進去,生怕錯過下一個微信。你果哥也是個沒事兒就喜歡焦慮的人,想了三天三夜,決定去做個人工智能的落地產品。

不瞞你們,你果哥之前是個很水的程序員,只會寫寫UI,調調API,連冒泡排序這樣的幼兒園算法,都要咬爛一支筆憋半天。就這水平去搞AI,好比茍到決賽圈還只有一把平底鍋,怎么跟人家98K八倍鏡拼啊。不過你果哥也是見過世面的人,有差距不可怕,為了知彼知己,就把人工智能領域里的專家教授扒了扒,看看他們都是在做什么。

這里面的第一類人,是學術界的大牛。人工智能其實是一門比較老的學科,上世紀4、50年代就出現了,但進展一直比較緩慢。這幾年有點噴薄的趨勢,一方面算力跟上來了,另一方面學術研究起了很大的作用。大家看很多入門書,講回歸分析、聚類,反向傳播,支持向量機,一大堆公式定理,涉及矩陣、概率、求導,都是學術界的工作。

隨著理論的發展,很多神經網絡模型被提出來然后完善。最基礎的圖像任務,識別定位檢測,有幾十個經典的CNN模型可以選。自然語言處理,從RNN到LSTM,記憶力越來越強。往往學術界一篇文章,可以帶來一個領域的繁榮,比如這幾年很火的對抗網絡,現在已經能幫你把片兒里的女演員換成你老婆gaki了。

這里面第二類人,是工業界的工程師。理論的落地,離不開工程的實踐。工程上大致有兩部分,一類是各種深度學習框架的開發,一類是AI產品的研發。

其實一開始的時候,并沒有什么框架,大家徒手搭神經網絡,卷積運算,梯度更新全都自己解決。后來有大牛站出來,說干脆我給你們寫一個框架,把這些基礎的、都用的著的、需要極致的運算速度的東西做了,你們資詞不資詞???

于是一下子出來很多框架。G家的tensorflow,基于Python和C++,很流行,但是實際上用起來并不咋地,對新手不友好,調bug不容易。tensorflow算是比較低級的框架,還是要寫很多無用的代碼,keras框架更上一層,基于tensorflow,幾行代碼就能搭起一個神經網絡。大牛賈清揚的caffe,元老級的框架,封裝的非常好,速度很快,社區也很活躍,但是,我咧個神哩,安裝起來那叫一個費勁?,F在在做caffe2,據說對移動端支持比較好。FB的Torch,學術界用的比較多,主要是它基于Lua,把我們這些培訓班學python出來的鄙視慘了。

都說未來是AI的時代,這里面有個很重要的前提是要有殺手級的產品落地?,F在落地比較好的,一個是一些推薦系統,已經從傳統的過濾算法,邁向了深度學習的路子。除此之外,如果C端不夠成熟,從B端切入也是個不錯的思路。

最后再說說,人工智能領域,還有一群從業者躲在墻角瑟瑟發抖,那就是大家說的調參狗。一個神經網絡從理論到落地,有這么幾個階段,一個是模型構建,就是把別人論文里的網絡搭建起來。然后是模型訓練,把自己需要的數據準備好,然后部署到顯卡上去跑,這個過程有很多參數要調,很玄,屬于老中醫看病,全靠經驗,妙,不可言。一名調參狗的日常是這樣的:

調參狗接到需求,第一件事就是去github和各種框架的model zoo上當搬運工。調參狗沒有設計網絡的能力,如果github上沒有,就只能看論文動手擼了,不僅費時費力,出了bug還得到處求人。

模型搭好了,調參狗開始徹夜整理數據。你果哥有句話常常掛在嘴上,就是有多少人工,就有多少智能。很多時候大家用的模型是一樣的,你牛逼就牛逼在有高質量的標注數據。實在沒有?威脅老板買買買啊。

數據準備好了,調參狗就開始調參了。嗯,先用默認值來一遍,不行,試試小一點的LR呢?不行,換個initializer試試?艾瑪,一不小心過擬合了,快快快,加大正則,加大正則還有救。

很不幸,你果哥干的就是調參狗的活。這不,沒日沒夜瞎折騰,時光小視頻終于上線了。它能幫你的手機相冊智能分類、整理、去差,做成小視頻,一鍵即成。無論是分享給親友,還是發抖音,都是逼格滿滿的。還不快玩起來,玩起來同學們~!

#專欄作家#

給產品經理講技術,微信公眾號(pm_teacher),人人都是產品經理專欄作家。資深程序猿,專注客戶端開發若干年,對前端、后臺技術略懂,熱衷于對新的科技領域的探索。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Pixabay,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 為啥我看這文章會邊看邊笑,文筆好幽默。

    來自北京 回復
  2. 這一篇有點太科,普得不夠啊 小白看不懂QAQ

    來自四川 回復
  3. 賈揚清不是賈清揚,去屑洗發水

    來自廣東 回復