การเรียนรู้ของเครื่องและการวิจัยคู่แข่ง SEO

เผยแพร่แล้ว: 2021-08-03

ผู้เชี่ยวชาญด้าน SEO หลายคนกำลัง เรียนรู้ Python และภาษาสคริปต์อื่นๆ ในปี 2021 เพื่อพัฒนาเกมของตน แนวโน้มที่เกี่ยวข้องอีกประการหนึ่งในอุตสาหกรรม SEO คือการเรียนรู้ของเครื่อง แมชชีนเลิร์นนิงหรือ ML สามารถช่วยคุณในการค้นคว้าข้อมูลของคู่แข่ง และอื่นๆ เราจะบอกคุณถึงวิธีการใช้แมชชีนเลิร์นนิงเพื่อทำการวิจัยของคู่แข่งและทำให้งานของคุณง่ายขึ้น

ความหมายของแมชชีนเลิร์นนิง

แมชชีนเลิร์นนิงเป็นสาขาหนึ่งของปัญญาประดิษฐ์ (AI) และวิทยาการคอมพิวเตอร์ที่ใช้ข้อมูลและอัลกอริทึมเพื่อเลียนแบบวิธีที่ผู้คนเรียนรู้ ทำงานโดยการสำรวจข้อมูลและวิเคราะห์รูปแบบ

เหตุใดแมชชีนเลิร์นนิงจึงมีความสำคัญสำหรับวัตถุประสงค์ด้าน SEO

สิ่งหนึ่งที่ ผู้เชี่ยวชาญ SEO ที่ยอดเยี่ยมหลายคนทำ คือวิเคราะห์หน้าผลลัพธ์ของเครื่องมือค้นหา (SERP) และคู่แข่งเพื่อดูว่าพวกเขากำลังทำอะไรเพื่อให้ได้อันดับสูง ในอดีต SEO ใช้สเปรดชีตเพื่อรวบรวมและวิเคราะห์ข้อมูลจาก SERP โดยมีคอลัมน์ต่างๆ ที่มีข้อมูลต่างกัน เช่น จำนวนลิงก์ จำนวนคำ เป็นต้น แม้ว่ากลยุทธ์นี้จะได้ผล แต่ Excel กลับมีข้อจำกัดในสิ่งที่ทำได้ แม้ว่า คุณรู้เคล็ดลับเช่น INDEX + MATCH และ VLOOKUP นอกจากนี้ ขณะนี้มีปัจจัยที่ซับซ้อนมากขึ้นที่ส่งผลต่อการจัดอันดับการค้นหา เช่น การใช้งานบนอุปกรณ์เคลื่อนที่ โซเชียลมีเดีย ความเร็วของหน้า มาร์กอัปสคีมา และอื่นๆ

อย่างไรก็ตาม ขณะนี้ มีเครื่องมืออย่าง Python/R ที่ช่วยคุณจัดการข้อมูลหลายล้านแถวในคราวเดียว คุณสามารถใช้แมชชีนเลิร์นนิงกับข้อมูลของคู่แข่งเพื่อเรียนรู้:

ปัจจัยการจัดอันดับใดที่พิจารณาความแตกต่างในการจัดอันดับเว็บไซต์
มาตรฐานที่ชนะเลิศ
ค่าหน่วยเปลี่ยนแปลงไปเท่าไหร่ในแง่ของอันดับ

แมชชีนเลิร์นนิงและ SEO

ปัญหา ML สำหรับการวิเคราะห์คู่แข่ง

ML แก้ปัญหาต่างๆ ได้หลายอย่าง เช่น การจัดหมวดหมู่สิ่งต่าง ๆ ซึ่งเรียกว่าการจำแนกประเภท หรือการทำนายจำนวนต่อเนื่องซึ่งเรียกว่าการถดถอย ในการวิเคราะห์คู่แข่ง คุณจะต้องมีปัญหาการถดถอย นั่นเป็นเพราะคุณภาพของ SEO ของคู่แข่งแสดงโดยการจัดอันดับของ Google ซึ่งเป็นตัวเลขที่ต่อเนื่องกัน

ตัวชี้วัดผลลัพธ์

ตอนนี้เรารู้แล้วว่าปัญหา ML คือการถดถอย เมตริกผลลัพธ์คืออันดับ ทั้งนี้เนื่องจากอันดับไม่ได้รับผลกระทบจากฤดูกาล และเนื่องจากอันดับของคู่แข่งเป็นข้อมูลของบุคคลที่สาม ซึ่งคุณสามารถค้นหาได้โดยใช้เครื่องมือและซอฟต์แวร์ SEO ซึ่งต่างจากการเข้าชมและ Conversion ของผู้ใช้ ซึ่งไม่พร้อมใช้งานสำหรับคุณ

คุณสมบัติ

ตอนนี้เรารู้เมตริกผลลัพธ์แล้ว ตอนนี้เราต้องกำหนดคุณลักษณะหรือตัวแปรอิสระ ชนิดข้อมูลสำหรับคุณสมบัติแตกต่างกันไป ตัวอย่างเช่น สีแรกที่วัดเป็นวินาทีจะเป็นตัวเลข ความรู้สึกที่มีหมวดหมู่เชิงบวก เป็นกลาง และเชิงลบจะเป็นปัจจัยหนึ่ง คุณจะต้องครอบคลุมปัจจัยการจัดอันดับให้ได้มากที่สุด เช่น ด้านเทคนิค เนื้อหา ประสบการณ์ผู้ใช้ และอื่นๆ เพื่อดำเนินการวิจัยที่ครอบคลุมมากที่สุด

วิธีการทำคณิตศาสตร์

เนื่องจากการจัดอันดับเป็นตัวเลข คุณจะต้องอธิบายความแตกต่างของอันดับด้วยตัวเลข คุณสามารถทำได้ด้วย:

อันดับ ~ w_1*feature_1 + w_2* + … + w_n*

เครื่องหมายตัวหนอน (~) หมายถึง "อธิบายโดย" n คือคุณลักษณะที่ n และ w คือน้ำหนักของจุดสนใจ

แมชชีนเลิร์นนิงคืออะไร

วิธีใช้แมชชีนเลิร์นนิงเพื่อค้นหาความลับของคู่แข่ง

เมื่อคุณรู้วิธีการคำนวณแล้ว คุณก็พร้อมที่จะดูว่าการเรียนรู้ของเครื่องจะช่วยให้คุณค้นพบข้อมูลเพิ่มเติมเกี่ยวกับการแข่งขันได้อย่างไร เราจะถือว่า ณ จุดนี้คุณได้รวบรวมข้อมูล SERPS ของคุณแล้ว (“serpa_data”) และได้เข้าร่วม แปลงสภาพ ทำความสะอาด และพร้อมสำหรับการสร้างแบบจำลอง ข้อมูลของคุณอย่างน้อยต้องมีข้อมูลการจัดอันดับและคุณลักษณะของ Google ที่คุณต้องการทดสอบ คอลัมน์ของคุณอาจรวมถึง:

Google_rank
Page_Sspeed
Flsch_kincaid_reading-Ease
ความรู้สึก
Site_depth
Amp_version_available
Internal_page_rank
อ้างอิง_domains_count
Avg_domain_authority_backlinks
Title_keyword_string_distance

วิธีฝึกโมเดลแมชชีนเลิร์นนิงของคุณ

ในการฝึกโมเดลของคุณ คุณจะต้องใช้ XGBoost เนื่องจากให้ผลลัพธ์ที่ดีกว่ารุ่น ML อื่นๆ หากคุณต้องการลองใช้ทางเลือกอื่น คุณสามารถไว้วางใจ RandomForest, Adaboost หรือ LightGBM สำหรับชุดข้อมูลขนาดใหญ่

นี่คือวิธีที่คุณใช้โค้ด Python สำหรับ XGBoost สำหรับชุดข้อมูล SERPS ของคุณ โปรดทราบว่านี่เป็นเพียงตัวอย่างพื้นฐาน สำหรับลูกค้าจริง คุณจะต้องลองใช้อัลกอริธึมแบบจำลองต่างๆ กับตัวอย่างข้อมูลการฝึกอบรม ประเมิน และเลือกแบบจำลองที่ดีที่สุด

นำเข้าไลบรารี

ขั้นตอนแรกคือการนำเข้าไลบรารีด้วยโค้ดบิตนี้:

นำเข้า xgboost เป็น xgb

นำเข้าแพนด้าเป็น pd

serps_data = pd.read_csv('serps_data.csv')

ตั้งค่าตัวแปรรุ่น

# ข้อมูล SERP ของคุณมีทุกอย่างยกเว้นคอลัมน์ google_rank

serp_features = serps_data.drop(คอลัมน์ = ['Google_rank'])

#ข้อมูล SERP ของคุณด้วยคอลัมน์ google_rank เท่านั้น

rank_actual = serps_data.Google_rank

ยกตัวอย่างโมเดล

serps_model = xgb.XGBRegressor (วัตถุประสงค์ = 'reg: เชิงเส้น', random_state = 1231)

พอดีกับรุ่น

serps_model.fit(serp_features, rank_actual)

สร้างการคาดการณ์แบบจำลอง

rank_pred = serps_model.predict(serp_features)

ประเมินความถูกต้องของแบบจำลอง

mse = mean_squared_error(rankactual, rank_pred)

วิธีใช้แมชชีนเลิร์นนิงสำหรับ SEO

สิ่งที่คุณสามารถเรียนรู้ได้จากข้อมูล

นี่เป็นเพียงบางสิ่งที่คุณสามารถเรียนรู้จากแบบจำลองของคุณ:

ตัวขับเคลื่อนอันดับที่ทำนายมากที่สุด

ข้อมูลจะบอกคุณถึงคุณลักษณะ SERP ที่มีอิทธิพลมากที่สุดหรือปัจจัยการจัดอันดับตามลำดับความสำคัญ ทุกตลาดหรืออุตสาหกรรมจะแตกต่างกัน

ปัจจัยการจัดอันดับมีค่ามากแค่ไหน

คุณยังสามารถดูได้ว่าอันดับจะถูกส่งไปมากน้อยเพียงใดโดยพิจารณาจากปัจจัยแต่ละอย่าง

เกณฑ์มาตรฐานที่ชนะสำหรับปัจจัยการจัดอันดับ

ข้อมูลยังจะบอกให้คุณทราบถึงเกณฑ์มาตรฐานการชนะสำหรับปัจจัยการจัดอันดับแต่ละรายการ ตัวอย่างเช่น แม้ว่าอาจมีกฎ SEO ทั่วไปบางอย่างที่คุณปฏิบัติตามสำหรับปัจจัยการจัดอันดับแต่ละรายการ แต่เกณฑ์มาตรฐานจริงสำหรับแต่ละปัจจัยอาจแตกต่างกันไปขึ้นอยู่กับตลาดหรืออุตสาหกรรม

คุณสามารถใช้ข้อมูลนี้เพื่อช่วยเพิ่มประสิทธิภาพเนื้อหาของคุณเพื่อเอาชนะคู่แข่งใน SERP

วิธีทำให้การวิเคราะห์คู่แข่ง SEO ของคุณเป็นแบบอัตโนมัติด้วยการเรียนรู้ของเครื่อง

แม้ว่าการวิเคราะห์ ML ของข้อมูลคู่แข่ง SEO จะมีความสำคัญ แต่ก็มีประโยชน์มากกว่าเมื่อทำอย่างต่อเนื่อง เพียงครั้งเดียวการวิเคราะห์การเรียนรู้เครื่องเป็นเพียงช่วงเวลาในเวลาสำหรับ SERPs เมื่อ SERPs มักจะเปลี่ยนแปลงและการพัฒนาที่เป็นอัลกอริทึมของ Google อย่างไรก็ตาม การรวบรวมและวิเคราะห์ข้อมูลอย่างต่อเนื่องช่วยให้คุณมีมุมมองโดยรวมที่ดีขึ้นเกี่ยวกับสิ่งที่เกิดขึ้นจริงใน SERP – และสาเหตุ – ในอุตสาหกรรมของคุณ (หรือลูกค้าของคุณ) นี่คือเหตุผลสำคัญที่ทำให้คู่แข่ง SEO ของคุณเป็นแบบอัตโนมัติ การวิเคราะห์ด้วยการเรียนรู้ของเครื่อง

นี่คือที่มาของระบบคลังข้อมูลและแดชบอร์ดที่สร้างขึ้นโดยมีวัตถุประสงค์เพื่อ SEO ระบบเหล่านี้นำข้อมูลของคุณทุกวันจากเครื่องมือ SEO ที่คุณเลือก รวมข้อมูล และใช้การเรียนรู้ของเครื่องเพื่อแชร์ข้อมูลเชิงลึกในแอปพลิเคชันส่วนหน้าที่คุณเลือก เช่น Google ดาต้าสตูดิโอ .

ในการสร้างระบบอัตโนมัติของคุณเอง คุณจะต้องปรับใช้ในโครงสร้างพื้นฐานระบบคลาวด์ เช่น Amazon Web Services หรือ Google Cloud Platform ในสิ่งที่เรียกว่า ETL หรือที่เรียกว่า ดึงข้อมูล แปลงรูปแบบ และโหลด การแยกข้อมูลหมายถึงการเรียก API เครื่องมือ SEO ของคุณทุกวัน การแปลงเป็นการล้างและวิเคราะห์ข้อมูลของคุณ กำลังโหลดกำลังฝากผลลัพธ์ที่เสร็จสิ้นลงในคลังข้อมูลของคุณ วิธีนี้ช่วยให้คุณรวบรวม วิเคราะห์ และแสดงข้อมูลเป็นอัตโนมัติได้ในที่เดียว

การเรียนรู้ของเครื่อง

แมชชีนเลิร์นนิงและการวิจัยคู่แข่ง SEO

การทำวิจัยคู่แข่งด้าน SEO อาจเป็นเรื่องยาก แต่แมชชีนเลิร์นนิงสามารถช่วยให้คุณง่ายขึ้น โดยเฉพาะอย่างยิ่งหากคุณทำให้กระบวนการเป็นอัตโนมัติ เมื่อคุณใช้แมชชีนเลิร์นนิงกับคู่แข่งของคุณ คุณสามารถเรียนรู้ว่าตัวขับเคลื่อนหลักคืออะไร ระบุเกณฑ์มาตรฐานที่ชนะจากคู่แข่ง และเรียนรู้ว่าการเพิ่มประสิทธิภาพของคุณสามารถเพิ่มอันดับได้มากเพียงใด หากคุณต้องการความช่วยเหลือในการใช้แมชชีนเลิร์นนิงเพื่อการวิจัยคู่แข่ง SEO โปรดติดต่อ SEO Design Chicago วันนี้และผู้เชี่ยวชาญ SEO ของเราสามารถช่วยคุณได้

คำถามที่พบบ่อย:

การเรียนรู้ของเครื่องคืออะไร?
ฉันจะตั้งค่าโมเดล ML ได้อย่างไร
ฉันต้องการข้อมูลใดบ้างสำหรับแบบจำลอง ML ในการวิจัยของคู่แข่ง
แมชชีนเลิร์นนิงช่วยวิจัยคู่แข่ง SEO ของฉันได้อย่างไร
ฉันจะทำให้การเรียนรู้ของเครื่องเป็นอัตโนมัติสำหรับการวิจัยคู่แข่ง SEO ได้อย่างไร