国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報網(wǎng)

如何通過分析大數(shù)據(jù)找到藍(lán)海項(xiàng)目

藍(lán)海情報網(wǎng) 2653

如何通過分析大數(shù)據(jù)找到藍(lán)海項(xiàng)目

今天,藍(lán)海情報網(wǎng)帶來一篇《如何通過分析大數(shù)據(jù)找到藍(lán)海項(xiàng)目》。

本篇內(nèi)容可能會涉及到SEO和編程知識,但都是基礎(chǔ)且通俗易懂的內(nèi)容。

一般我尋找項(xiàng)目的時候會側(cè)重于挖掘用戶的需求,然后歸類,數(shù)據(jù)量越大,找到的需求就越清晰。

通常,我們搜索需要的內(nèi)容時,一般都會帶怎么、什么這兩種詞,所以,今天就用這兩個詞舉例。

首先,打開5118官網(wǎng),使用查詢長尾詞工具,搜索:怎么

5118官網(wǎng)

右上角導(dǎo)出數(shù)據(jù)(年VIP可以導(dǎo)出50W條),這樣我們可以獲得大量的長尾詞。

但是詞數(shù)有5億多,我們可能只能下載幾十萬,數(shù)據(jù)太分散,不一定有代表性,全部下載分析也不太現(xiàn)實(shí),所以我們只需要提取有代表性的詞即可,具體方法是:

將剛才導(dǎo)出的50W數(shù)據(jù),用工具把一個個完整長尾詞分成詞根,比如:

QQ郵箱格式怎么寫: QQ、郵箱、格式、怎么、寫

邊分詞的時候邊自動記錄每個詞根的次數(shù),即詞頻,結(jié)果保存到Excel里,然后在Excel里按照詞頻倒序排序出來:

分詞詞根

然后把 怎么+高頻詞根,再去5118上面拓展,導(dǎo)出,重復(fù)這個步驟(不包含再分詞,分詞只做第一次),拓展出來的詞必定包含 怎么和高頻詞根。

關(guān)鍵詞往往符合2/8定律,把能覆蓋80%詞量的20%詞根都拿去拓展,基本就能收集到有代表性的詞庫了,這里也可以結(jié)合常識:怎么這個詞跟哪個詞應(yīng)該是經(jīng)常出現(xiàn)的,結(jié)合后應(yīng)該有很多長尾詞的,也可以一起拿去拓展,比如:怎么制作

通過上面的步驟,我們已經(jīng)導(dǎo)出了較為有代表性的長尾詞庫,這時你可能有百萬級的關(guān)鍵詞數(shù)據(jù)了。

為了讓數(shù)據(jù)更精準(zhǔn),接下來繼續(xù)用百度搜索:百度推廣,進(jìn)入百度鳳巢后臺,沒有賬戶自己注冊一個。

步驟和5118的處理方式是一樣的,這兩個只是渠道不同而已,5118數(shù)據(jù)量大,而百度的搜索數(shù)據(jù)無論是詞還是搜索量都是官方的,很權(quán)威,我們的目的是盡可能的收集到足夠多足夠有代表性的詞庫:

百度的數(shù)據(jù)一次不會拓展出很多,需要更多的數(shù)據(jù),就需要不斷的拓展,按我個人經(jīng)驗(yàn),拓展幾次,有幾萬個詞就足以,因?yàn)榘俣葍?yōu)先給你的都是搜索量相對高的,這樣的詞本身就具備代表性。

拓詞到了這一步,其實(shí)已經(jīng)累計出挺多的數(shù)據(jù)了,如果你覺得差不多了那也行,不需要再去找其他挖詞工具,百度和5118還有站長工具足夠覆蓋,當(dāng)然了,搜索引擎除了百度,還有其他:搜狗、好搜、神馬,他們也一樣有對應(yīng)的工具,一樣可以按照先前的步驟去處理。

步驟2:

現(xiàn)在我們已經(jīng)有了一批詞庫,可能有小幾百萬,分散在幾個Excel里,詞庫里幾乎覆蓋了所有包含怎么這個詞的各類長尾詞(可能有些詞并沒有被我們收集到,但是跟它近似的同義的詞我們一定有,這就夠了)。

接下來簡單處理數(shù)據(jù),包括:

去重、去長、去短、去無效詞,去非目標(biāo)詞。

我們先把各Excel里的數(shù)據(jù),除關(guān)鍵詞這一列,其他列都刪除,那些搜索數(shù)據(jù)、長尾數(shù)量、競爭程度,不是我們此次的分析目標(biāo),沒有參考意義,我們只要關(guān)鍵詞這一列。

數(shù)據(jù)處理

鑒于數(shù)據(jù)量太大,處理數(shù)據(jù)的操作,Excel基本操作不了,而且多個分別處理也不科學(xué),所以還是用腳本,我個人建議使用Python處理,只是簡單的寫些循環(huán)語句就可以了,最后把數(shù)據(jù)都保存到一份TXT文檔中。

步驟3:

以上步驟都完成了后,我們得到了一份干凈的關(guān)鍵詞數(shù)據(jù),它保存在一份TXT中:

關(guān)鍵詞數(shù)據(jù)

盡管已經(jīng)做了處理,但是幾十萬甚至幾百萬的關(guān)鍵詞擺在我們眼前,依然眼花繚亂,我們根本記不住什么。

所以這里用了一個詞向量文本分類技術(shù),是一種計算文本相似度的方法。

不要被這個名稱嚇到,他運(yùn)用到的數(shù)學(xué)知識就一個,還僅限于初中水平。

詞庫里的詞相互之間互相比對,兩兩比對時,計算各自的詞根向量,然后再計算兩組向量的余弦值,越接近1,則表示兩個詞越相似,完全一樣的詞則會輸出1,當(dāng)兩個詞相似度大于一定值(可不斷計算再根據(jù)結(jié)果調(diào)整,自己根據(jù)經(jīng)驗(yàn)設(shè)定,比如0.8),則將它們歸為一類,比如:

QQ郵箱格式怎么寫 和 QQ郵箱格式如何寫

所有詞根包含:QQ、郵箱、格式、怎么、如何、寫

把每個詞根分別到兩個長尾詞里挨個計算詞頻,即可轉(zhuǎn)換為兩組向量:

(1,1,1,1,0,1)、(1,1,1,0,1,1)

兩者計算余弦值等于:0.8

這是技術(shù)思路,實(shí)現(xiàn)起來還有挺多麻煩的事情,這里不展開討論。

自動歸類完后的數(shù)據(jù)如下顯示:

自動歸類完后的數(shù)據(jù)

這樣一份Excel,已經(jīng)自動幫我們歸類好相似的關(guān)鍵詞,不同類的詞會間隔開,好處在于:

1:某些詞可能只是小部分字眼不同,但實(shí)際表述的都是一件事,程序能幫你歸類出來

2:聚集在一起的一批詞,我們一眼就可以看出這是一個什么樣的需求,越多越清晰

3:相關(guān)的已經(jīng)歸類在一起了,后面不會再出現(xiàn)類似需求,不會反復(fù)干擾

一份百萬級的詞庫文檔,被我們歸類成了若干份獨(dú)立的需求集合,剩下的就是花時間去看,看到有意思的、合適的、不可思議的需求,都可以去了解,慢慢品,一定有很多你想象不到但就是真實(shí)存在的需求。

當(dāng)然了,不是什么需求都一定有商業(yè)價值,也不是什么需求都可以做。

當(dāng)我們在文檔里看到一個想了解的需求,應(yīng)該怎么做呢?

步驟4:

比如我發(fā)現(xiàn)一個挺有意思的東西:

PDF轉(zhuǎn)Word

你可能經(jīng)常看到PDF轉(zhuǎn)Word的需求,但是轉(zhuǎn)成一張圖,應(yīng)該很少見,如果平時看到了也不會在意,但是當(dāng)一片詞出現(xiàn)在你眼前時,你就會覺得奇怪,現(xiàn)在我們拿到百度搜索看看:

PDF轉(zhuǎn)Word

不搜你都不知道,首屏5個廣告位全滿,原來這么不起眼的東西也能賺錢,一個PDF轉(zhuǎn)圖片的小功能,大不了自己截圖一下的事情,居然也可以拿來做成一個服務(wù)賣給別人,而且競爭還很激烈。

能賺多少?好賺嗎?不知道!

如果你確定想做某個項(xiàng)目時,最好花錢購買一次,體驗(yàn)一遍所有環(huán)節(jié),這樣你就能獲取一套完整的文案了。

藍(lán)海情報網(wǎng)持續(xù)跟蹤了他們一段時間,如果每天還在投錢,大概率是能賺的,接下去,你就依樣畫葫蘆吧,當(dāng)然了,如果能找到他們當(dāng)中的不足之處加以優(yōu)化,那更好。

除了百度,任何你能找到的搜索引擎,比如:淘寶、微博、抖音、頭條、微信,都可以拿去搜一搜,你會發(fā)現(xiàn)商機(jī)越來越明確、思路越來越明朗。

微信上有人做了專門的小程序和公眾號

小程序和公眾號

關(guān)鍵詞就是有這樣的特性,我們靠想,是絕對不可能憑空想出來的,即使人家就是用這個在賺著錢,但是我們就是不知道,而把數(shù)據(jù)都收集過來,再分類,那就可以清晰的一個個去了解了。

幾個小細(xì)節(jié)提一下:

1:無論是拓詞還是歸類,這兩個環(huán)節(jié)都很依賴分詞這個功能,分詞包含兩個重要問題:詞頻文檔建立、忽略無效詞根。

這兩點(diǎn)做得好,詞頻更有效、歸類更準(zhǔn)確

2:上述以怎么這個詞做演示,其實(shí)類似的:什么、如何、怎樣、能不能、是不是、可不可以、需不需要,等等等等都是一樣的,有精力可以把這些都做一遍,在程序歸類的過程中,把這些詞都忽略掉,在計算相似度時,不考慮他們

3:我們之前挖掘到項(xiàng)目之后,做了一段時間的考察,然后選擇在廣告平臺做付費(fèi)投放,但并不是什么項(xiàng)目都一定要做成生意,當(dāng)你發(fā)現(xiàn)很多人會問一些問題,那么是不是可以考慮把這些做成自媒體(文章、短視頻),持續(xù)的輸出相關(guān)領(lǐng)域的內(nèi)容,又或者你可以專門開發(fā)出一門網(wǎng)課,畢竟現(xiàn)在是知識付費(fèi)時代、內(nèi)容創(chuàng)作時代。

小結(jié):

關(guān)于程序方面的相關(guān)處理,我再考慮有空整理一份出來,力求可以讓非業(yè)內(nèi)人士也能直接上手操作,我希望大家明白的是,技術(shù)只是解決問題的手段,思路才是關(guān)鍵,所以技術(shù)本身并不值錢也不可怕,不要把心思花在這方面。

如果你已經(jīng)有所啟發(fā),立刻動起來吧,去找到合適你創(chuàng)業(yè)的項(xiàng)目。

看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽:

ad2

推薦內(nèi)容