作為在線教育行業(yè)中的一份子,無形中總有一種使命感。畢竟目前在線教育行業(yè)如火如荼,人們對學(xué)習(xí)的欲望似乎空前高漲,坐地鐵都能看到旁邊的小伙子手捧手機不是在追《花千骨》,而是在看《Java進階教程》,吾不禁深感欣慰。
和整個行業(yè)急速發(fā)展相對應(yīng)的,卻是我們視頻制作者工作量的與日俱增。越來越火的行業(yè),意味著越來越多的需求,每天坐在電腦前面對成堆的項目片段十指齊飛的時候,我都會深深思考:就沒有什么黑科技能解救我們這些苦逼的視頻制作者嗎?
其實,還真有。
圖像識別自動選取素材
巧婦難為無米之炊,做視頻最需要素材片段。但是當(dāng)我們準備好了大部分素材剛好差一個特寫片段,或者需要在大段大段的視頻里去找某一個鏡頭的時候,那種無處可搜的感覺真的讓人抓狂。
如果能用圖像識別技術(shù)去搜索視頻——當(dāng)然現(xiàn)在的圖像識別還遠遠不夠智能,它們連一只貓都要認半天(但是認裸體不雅照已經(jīng)頗有心得,參看《Isitnude-網(wǎng)站中的終極“鑒黃師”》),如果靠圖像識別找素材已經(jīng)值得期待,那時,搜素材就會和搜詞一樣簡單,甚至一個Ctrl+F就能解決。
谷歌黑科技自動剪輯
前段時間谷歌出了一款黑科技:可以把一系列照片無縫組合成為視頻,甚至聯(lián)想補充出原本沒有的畫面。如果此技術(shù)成熟應(yīng)用到視頻領(lǐng)域,到時我們只要把必要的素材片段導(dǎo)進去,就可以直接生成完整的視頻啦。對于那種訪談、演講、培訓(xùn)類鏡頭固定的視頻,簡直能達到流水線作業(yè)水平。
語音識別自動加字幕
字幕看似是一個可有可無的東西,對一些人卻有著特殊的意義。曾經(jīng)有個聽障人士就問我,能不能有這么一個軟件,在播視頻的時候,下面就直接出來了字幕?因為他聽不到。
居然還真有公司做出來了,就叫“字幕大師”。據(jù)說純智能操作,無需手工調(diào)整字幕:把音頻和文本導(dǎo)進軟件,根據(jù)語音識別技術(shù)就會自動幫你對齊發(fā)音與文字,不用自己拖調(diào),最后導(dǎo)出的就是帶時間軸的字幕文件,簡直跟面包機一樣的操作模式。語音輸入我們已經(jīng)司空見慣,這種字幕生成軟件其實采用的是同樣的技術(shù)。語音識別本身就是把聲音轉(zhuǎn)換成文字,用此技術(shù)做時間軸,甚至能逐字對齊,簡直大材小用。可惜現(xiàn)在國內(nèi)外語音識別還不夠成熟,如果真能達到100%的準確率,甚至能純靠對白識別出文字,完全摒棄文本,那才是真正的黑科技。