5118,司機國內知名的年(′_`)實(shí)站長(cháng)平臺之一,我是經(jīng)驗每天都要上幾回。
前段時(shí)間官方出了幾張運營(yíng)地圖(tu),分??享每張??都真真的司機是干貨滿(mǎn)滿(mǎn),而這只是年實(shí)其中一張。
算是經(jīng)驗個(gè)人留著(zhù)??壓箱底私藏貨之一,共學(xué)。分享
干預搜索引擎
被動(dòng)爬取干預
蜘蛛
種類(lèi):1、司機頁(yè)面內容蜘蛛。年實(shí)2、經(jīng)驗圖片收集蜘蛛。分享3、司機模擬真(?⊿?)實(shí)瀏覽器反作弊爬蟲(chóng)(含JS)
索引:1、年實(shí)收錄率=收錄數量/爬取數量。經(jīng)驗2、定期進(jìn)行WEB日志檢查、計算收錄率、收錄率非常低,需要增加內容質(zhì)量和外鏈。
技巧
真假蜘蛛辨識別技巧
引導爬蟲(chóng)抓取新頁(yè)面:制作更新列表??網(wǎng)頁(yè)并放置在所有頁(yè)面底ヽ(′▽?zhuān)?ノ部、在內容頁(yè)面放置專(zhuān)門(mén)的列表,跟隨爬蟲(chóng)訪(fǎng)問(wèn)放出新鏈接
主動(dòng)提交
sitemap
TXT文本格式(百度)
XML格式(谷歌)
通知方式:1、可以在rob??ots.txt文件添加代碼告知sitemap存放位置。2、可以通過(guò)站長(cháng)(′?`)后臺一次提交10個(gè)sitemap地址。
要求:1、不得超過(guò)5萬(wàn)個(gè)。2、文件大小不(′?ω?`)超過(guò)10MB。3、ヾ(?■_■)ノ不能是404。
死鏈提交–XENU掃描–及時(shí)刪除鏈接–主動(dòng)提交站長(cháng)后臺
網(wǎng)站改版:1、鏈接301??跳轉。2、站長(cháng)后臺閉??站保護。3、查看日志確保無(wú)誤。4、死鏈多層掃描。
是否允許索引:1、robots.txt。2、meta。3、http header。4、html。
搜索引擎排名核心
搜索引擎指標
內容相關(guān)性指標:1、title( ?ヮ?)標題。2、metakeyworヽ(′ー`)ノd。3、maetadescription。4、內鏈:全站結構、描文本。5、外(wai)鏈:描文本、對方內容、相關(guān)度。6、內容:頭部文字、段落標題、內容涉及、相關(guān)內容。
原創(chuàng )性ヽ(′▽?zhuān)?ノ指標
落地頁(yè)時(shí)間因子
落地頁(yè)時(shí)間因子是百度搜索判斷網(wǎng)站收錄、展???示、排序結果的重要參考依據,百度搜索綜合用戶(hù)對落地頁(yè)中關(guān)于時(shí)間因子的實(shí)際感受,發(fā)現目前┐(′ー`)┌PC端及移動(dòng)端大量網(wǎng)站落地頁(yè)存在時(shí)間標注不清、頁(yè)面無(wú)時(shí)間等對用戶(hù)瀏覽體驗不友好行為。
內容更新時(shí)間:1、??時(shí)間標簽更新時(shí)間。2、百度快照代表索引更新時(shí)間。
內容原創(chuàng )性:1、詞頻:TF-IDF算法、LDA算法┐(′ー`)┌。2,搜索指紋:simhash。3,內容詞向量:doヾ(′?`)?c2vrc。
可訪(fǎng)問(wèn)性指標
蜘蛛爬取速度
WEB日志診斷:1、云服務(wù)器日志。2(′▽?zhuān)?)、ELK系統。3、filbeat+elasticsearch.
400/500錯誤數:1、WEB日志診斷。2、百度站長(cháng)后臺。3、Google站長(cháng)后臺。
頁(yè)面最終加載速度:1、工具:Googlepagespee(′?`)d。2、??相關(guān)因素:html、dom結構、js。
用戶(hù)行為指標
懲罰算法:【SEO優(yōu)化】SEO運營(yíng)地圖-百度算法大全匯總高清圖
是否解決(╬?益?)用戶(hù)問(wèn)題
點(diǎn)擊率:擊中人心的摘要、吸引人(ren)的標題、擊中需(xu)求的頭圖
是否會(huì )在搜索結果點(diǎn)擊下一個(gè)結果:快排原理–搜索結果點(diǎn)擊行為模擬
初期營(yíng)銷(xiāo):1、一定要能找到用戶(hù)集中的地方。2、SEM。3、長(cháng)尾詞SEO。4、高權重網(wǎng)站霸屏。5、激起傳播(社交媒體、抖音、論壇消息)
中期營(yíng)銷(xiāo):1、霸屏。2、問(wèn)答。
監ヽ(′?`)ノ控搜索引擎
可(ke)用性監控
日志分析
站長(cháng)平臺:抓取異常、抓取頻次
監控寶
百??度云觀(guān)測
百度競價(jià)版高級統計
自開(kāi)發(fā)轉化監控
流量監控
日志分析
常用統計系統功能
跳出率與訪(fǎng)問(wèn)時(shí)長(cháng)
轉化率
流量分類(lèi):(?⊿?)1、搜索引擎流量。2、直接流量。3、外鏈流量。
真實(shí)來(lái)源關(guān)鍵詞
受訪(fǎng)網(wǎng)頁(yè)
新老訪(fǎng)客
受訪(fǎng)域名:是否被鏡像
流量關(guān)鍵詞
SEO成果監控
站長(cháng)平臺
索引量
sitヽ(′ー`)ノe查詢(xún):百度查詢(xún)site:www.域名.com
5118
排名趨勢圖:百度PC、百度移動(dòng)、360、百家號、神馬、熊掌號???(非熊掌號)
站群監控
關(guān)鍵詞監控
站長(cháng)工具箱子:1、實(shí)時(shí)排名查詢(xún)。2、實(shí)時(shí)收錄查詢(xún)。3、nofollow工具。4、實(shí)時(shí)死鏈查詢(xún)。
首頁(yè)外鏈查詢(xún)
收錄量趨勢圖
頁(yè)面與內??容
HTML布局策略
第一段落包含目標詞
TDK:網(wǎng)頁(yè)描述、目標關(guān)鍵??詞擴展詞、目標關(guān)鍵詞
密度閥值
中文分詞算法理解:決定標題、內容中的關(guān)鍵詞是否可分
關(guān)鍵詞目標與類(lèi)型
核心詞擊中(zhong):用主頁(yè)占領(lǐng):不超過(guò)3個(gè)核心詞
搜多頁(yè):1、相關(guān)搜索。2、支持重(zhong)要搜索詞設置標題。
內容頁(yè):1、strong標簽。2、h標簽。3、內鏈
次要核心詞擊中
專(zhuān)題(ti)聚合頁(yè):1、內容精選。2、不斷更新。3、h標簽。
列表頁(yè):支持自動(dòng)以標題。
如何生產(chǎn)內容
題材來(lái)源
熱榜
需求圖譜
內容規劃
原創(chuàng )來(lái)源
自己寫(xiě)內容、偽原創(chuàng )、信息差、精華段落聚合重組:知乎、頭條、微信等全網(wǎng)文章、爬蟲(chóng)索引不到、UGC、采集
爬蟲(chóng)索引不到
技術(shù)、??紙張資料、語(yǔ)音資料、視頻資料、非HTML格式、需要登錄、外文、繁體
新媒體第一時(shí)間捕捉
不同平臺??索引時(shí)間差:微信、頭條、知乎、1點(diǎn)資訊、搜狐號、大魚(yú)號??、百家號、網(wǎng)易號、簡(jiǎn)書(shū)、鳳凰號
采集(′_`)
爬蟲(chóng)最佳語(yǔ)言:python、nodejs、go
web技術(shù):js(′▽?zhuān)?)、http協(xié)議、co(′?ω?`)okies
提取技術(shù):DO??M、正則
偽原創(chuàng )
工具:5118、文字、圖片、視頻、聲音
結構與設計
外部鏈接
HTML:1??、a標簽:rel屬性、title屬性。2、img標簽:alt屬性。3、link標簽:rel屬性。
外部(′_ゝ`)鏈接獲取方式:購買(mǎi)、自然傳播、友情鏈接、能留鏈接的地方、站群、入侵篡改。
內部層次結構
不但利于用戶(hù)也為引導蜘蛛
菜單導航:網(wǎng)站地圖、方式
內鏈:種類(lèi)、喂食爬蟲(chóng)鏈接、html標簽
安全性
防采集:1、IP訪(fǎng)問(wèn)分級機制。2、鍵盤(pán)鼠標??行為。3、用戶(hù)訪(fǎng)問(wèn)分級機制。4、瀏覽器指紋。5,給假數據。6,驗證碼。7,防模擬搜索引擎爬蟲(chóng)。8??,登陸。9、CSS+圖片位移防采集。10、建立黑名單。11、必須完(╥_╥)整渲染JS。12、圖片防??采集。
數據安全:1、磁盤(pán)陣列。2、主從備份、3、線(xiàn)(xian)下備份。4、文件云備份。
防攻擊:防DDOS
防入侵(杜絕潛在漏洞):HTTPS、補丁、用戶(hù)權限、社會(huì )工程、開(kāi)源程序反掃(′▽?zhuān)?)描、被動(dòng)檢測、端口檢測
可訪(fǎng)問(wèn)性
內部因素:程序與流程優(yōu)化
WEB服務(wù):廠(chǎng)商–iis/apache/nginx
URL:URL設計、URL路由( ???)
數據庫訪(fǎng)問(wèn):調優(yōu)分析、主從庫、并行擴展、讀寫(xiě)分離、備份、磁??盤(pán)類(lèi)型
靜態(tài)化:html靜態(tài)、局部靜態(tài)化、指標、性?xún)r(jià)比
緩存:分布式緩存、json緩存、定期關(guān)注硬性指標
前(′▽?zhuān)?端框架:對SEO不友好、避免使用W??EB SQL、使用indexedDB
流量?jì)?yōu)化:負載均衡、指標、確認冗余、減少冗余代碼和http請求、監控、工具
正確的跳轉:300/400/500
SEO程序及平臺(′?`)選擇:開(kāi)源cms、第三方建站、百家號、自開(kāi)發(fā)程序、第三方博(′ω`)客、小程序、第三方B2B
外部因素:DNS
常用測速:
CD???N解析:cdn本身就用了類(lèi)似云解析或者智能解析技術(shù)
記錄:A記錄、CNAM??E記錄
域名結構:頂級域名、二級域名、三級域(yu)名
常用服務(wù)商:海外:clou(╯°□°)╯︵ ┻━┻dflare、aws等??。國內:阿里云、騰訊云、百度云等。
CDN
優(yōu)點(diǎn):本地cache加速??、鏡??像服務(wù)、遠程加速、寬帶優(yōu)化
缺點(diǎn)(dian):應用成本、只對靜態(tài)(O_O)內容加速、內容更新時(shí)需要分發(fā)到其他節點(diǎn)。
應用場(chǎng)景:大文件下載、靜態(tài)網(wǎng)頁(yè)、應用加速、動(dòng)態(tài)加速
服務(wù)商:網(wǎng)宿科技、云服務(wù)商、海外
機房/數據中心
主機選擇注意:1、地理位置。2、可用性。
傳統IDC選擇注意:1、環(huán)境。2,能用(◎_◎;)。3,電信線(xiàn)路ヾ(′▽?zhuān)??。4,監控設備。5,客戶(hù)位置。
測速和監控工具
Copyright ? 2012-2018 天津九安特機電工程有限公司 版權所有 備案號: