ปฏิเสธไม่ได้ว่าในการทำ SEO สิ่งสำคัญที่ขาดไม่ได้และเป็นเหมือนดั่งปัจจัยหลักในการขับเคลื่อนเว็บไซต์เลยคือ Content หรือเนื้อหาประกอบหน้าเว็บไซต์ ไม่ว่าจะเป็นข้อความ เนื้อหาประกอบภาพ หรือบทความ หลายคนคงรู้กันอยู่แล้วว่าไม่ว่าจะทำอะไร Content ก็เป็นเหมือนดั่งใจกลางความสำเร็จ เหมือนดั่งคำกล่าวที่ว่า “Content is King” และในการทำ SEO เอง เนื้อหา (Content) ก็นับเป็นหนึ่งในความสำเร็จที่ขาดไม่ได้ แต่ในการทำเนื้อหาก็มีปัญหาหนึ่งที่มักเกิดขึ้นบ่อยแบบไม่ได้ตั้งใจ (หรือตั้งใจ) นั้นคือ Duplicate content ที่สร้างผลเสียต่อการทำ SEO แบบไม่รู้ตัว ซึ่งในบทความครั้งนี้เราจะพาไปทำความรู้จักกับปัญหานี้กันว่าแท้จริงแล้วมันคืออะไร ส่งผลเสียต่อการทำ SEO มากน้อยแค่ไหน และมีวิธีป้องกันอย่างไร?
Duplicate content คืออะไร
“Duplicate content” หรือ “เนื้อหาซ้ำกัน” คือ การที่มีเนื้อหาหรือข้อความที่ปรากฏบนเว็บไซต์หรือหน้าเว็บเพจมีลักษณะคล้ายคลึงหรือเหมือนกันกับเนื้อหาบนเว็บไซต์อื่น ๆ ไม่ว่าจะเป็นรูปแบบการเขียน สำนวน วลี หรือการเรียบเรียง แม้จะมีการปรับเปลี่ยนข้อความหรือเปลี่ยนแปลงรูปแบบการเขียน แต่ถ้ายังมีส่วนที่เหมือนกันมากเกิน 80% ก็ถือว่าเข้าค่ายเนื้อหาซ้ำกันได้เช่นกัน
โดยปัญหาเนื้อหาซ้ำกันเกิดขึ้นได้หมด ไม่ว่าจะเป็นภายในเว็บไซต์เดียวกันหรือเว็บไซต์ภายนอก ที่อยู่บนโลกอินเทอร์เน็ต เพื่อให้เข้าใจสิ่งนี้ได้ง่ายกว่าเดิม ลองคิดภาพว่าเนื้อหาที่ซ้ำกันก็เหมือนกับการที่เรามีหนังสือ 2 เล่มที่เขียนเรื่องเดียวกัน เนื้อหาคล้ายกัน แต่มีภาพหน้าปกที่แตกต่างกัน แม้ว่าภาพหน้าปกจะแตกต่างกันแค่ไหน แต่เนื้อหาภายในยังคงเป็นเรื่องเดียวกัน โดยปัญหาของ Duplicate content คือ การที่เครื่องมือค้นหาอย่าง Google เกิดความสับสนว่าควรจะแสดงเนื้อหาแบบไหนให้กับผู้ใช้งานหรือผู้ค้นหาดี เพราะทั้งสองแหล่ง (หรือมากกว่านั้น) มีเนื้อหาที่คล้ายคลึงหรือเหมือนกัน ซึ่งจะส่งผลกระทบต่อการจัดอันดับเว็บไซต์กับเว็บที่ทำ SEO เป็นอย่างมาก
สาเหตุของการเกิด Duplicate content
ปัญหาอย่าง Duplicate content บนเว็บไซต์เกิดขึ้นได้จากหลายสาเหตุ ไม่ว่าจะในเว็บไซต์เดียวกันเอง หรือเนื้อหาซ้ำกับเว็บไซต์อื่น ๆ ซึ่งสิ่งเหล่านี้ส่งผลกระทบต่อการทำ SEO และการจัดอันดับเว็บไซต์ การเข้าใจสาเหตุอาจจะทำให้คุณป้องกันปัญหาและผลกระทบได้ โดยสาเหตุหลัก ๆ ได้แก่
- การคัดลอกเนื้อหา
สาเหตุของการเกิดปัญหาเนื้อหาซ้ำกันลำดับต้น ๆ อย่างการคัดลอกเนื้อหา คือการเอาเนื้อหาจากเว็บอื่นมาใส่ในเว็บของเราโดยไม่มีการใส่แหล่งที่มาหรือไม่มีการปรับปรุง เปลี่ยนแปลงเนื้อหาแต่อย่างใด คัดลอกและวางลงบนหน้าเว็บทันที ซึ่งส่งผลให้เนื้อหาเหล่านี้ปรากฏอยู่บนหลาย ๆ เว็บที่ URL แตกต่างกัน การคัดลอกเนื้อหาอาจเกิดขึ้นได้จากเว็บไซต์อื่นมาคัดลอกเนื้อหาของเว็บเราโดยไม่ได้รับอนุญาต ไม่ใส่แหล่งอ้างอิงหรือให้เครดิต หรือการที่เราเองไปคัดลอกเนื้อหาจากแหล่งอื่นมาใช้ (โดยตั้งใจหรือไม่ตั้งใจ) โดยไม่ใส่แหล่งที่มาหรือให้เครดิตเช่นกัน
- URL ที่คล้ายกันหรือมีมากกว่า 1 ชุด
บางเว็บไซต์อาจจะมีการสร้าง URL ที่ไม่สอดคล้องกับเนื้อหาหรือคำหลักที่ใช้งาน หรือมีการสร้าง URL หลายรูปแบบสำหรับหน้าเว็บเดียวกัน โดยมีเนื้อหาที่เหมือนกัน แต่ URL แตกต่างกันเล็กน้อย ยกตัวอย่างเช่น หน้าเว็บ A มีเนื้อหาเหมือนกับหน้าเว็บ B แต่แตกต่างกันเพียงแค่การเข้าถึงเว็บแบบ HTTP และ HTTPS หรือมีการเข้าถึงผ่าน www และไม่มี www สิ่งเหล่านี้ทำให้เกิดปัญหาเนื้อหาซ้ำกันได้บน URL ที่แตกต่างกันบนเว็บไซต์เดียวกัน ยกตัวอย่าง URL ที่มักมีลักษณะคล้ายกันมากกว่า 1 ชุด- https://www.yoursite.com
- https://yoursite.com
- http://www.yoursite.com
- http://yoursite.com
- การเปลี่ยนเส้นทาง URL ที่ไม่ถูกต้อง
เว็บไซต์ที่ทำมานานหรืออาจจะมีการสร้างหน้าเว็บใหม่ รวมไปถึงการเปลี่ยนเส้นทาง URL โดยไม่ได้มีการตั้งค่าการเปลี่ยนเส้นทางอย่างถูกต้อง (redirect) ซึ่งส่งผลให้เนื้อหาเดิมที่อยู่บน URL (เก่า) ยังสามารถเข้าถึง และแสดงเนื้อหาหาเก่าอยู่ ทำให้เกิดปัญหาเนื้อหาซ้ำกับเนื้อหาที่อยู่บน URL ใหม่บนเว็บไซต์เดียวกัน
Duplicate content ส่งผลต่อการทำ SEO มากแค่ไหน?
แน่นอนว่า Duplicate content เป็นปัญหาสำหรับเครื่องมือค้นหาอย่าง Google ที่ต้องทำหน้าที่ในการจัดอันดับเว็บไซต์ตามเนื้อหาหรือคำหลัก (Keyword) ซึ่งปัญหานี้ทำให้เครื่องมือค้นหาเกิดความสับสนเป็นอย่างมาก รวมไปถึงเป็นการสร้างเนื้อหาที่ไม่เป็นประโยชน์ต่อผู้ค้นหารือผู้ใช้งาน จนทำให้เกิดผลเสียต่อการทำ SEO ในเรื่องของการจัดอันดับเว็บไซต์ โดยผลกระทบปัญหาเนื้อหาซ้ำกันที่ส่งผลต่อ SEO มีดังนี้
- ลดการจัดอันดับเว็บไซต์
เครื่องมือค้นหาอย่าง Google ไม่ชอบการที่มีเว็บไซต์คัดลอกเนื้อหาเหมือนกันหรือคัดลอกมาจากเว็บไซต์อื่น ๆ จึงทำให้ทาง Google ตัดสินใจลดอันดับเว็บไซต์ที่มีเนื้อหาเหมือนกันลงในทันที ยกตัวอย่างให้เข้าใจง่าย ๆ สมมติว่า มีเว็บหน้า A B C ที่มีเนื้อหาเหมือนหรือคล้ายกันมาก Google ไม่แน่ใจว่าหน้าเว็บไหนกันแน่ที่เป็นเว็บต้นฉบับ จึงตัดสินใจแก้ปัญหาด้วยกันลดอันดับทั้ง 3 เว็บลงไปในทันที แบบไม่สนว่าใครจะเป็นต้นฉบับหรือใครคัดลอกมาแต่อย่างใด
แต่การลดจัดอันดับจะไม่มีผลกับเว็บไซต์ที่มีเนื้อหาเป็นต้นฉบับจริง ๆ ที่ไม่ได้ทำการคัดลอกเนื้อหาจากเว็บอื่นแต่อย่างใด (Google สามารถรู้ได้ด้วยเช่นกัน)
- เพิ่มบทลงโทษให้เว็บไซต์ (ยกเลิกการจัดอันดับ)
บางครั้งเว็บไซต์ที่มีปัญหาเนื้อหาซ้ำกัน ไม่ได้เพียงแค่ถูกลดการจัดอันดับเว็บบนหน้าผลการค้นหา (SERP) เท่านั้น แต่อาจจะถูกทางเครื่องมือค้นหาอย่าง Google เพิ่มบทลงโทษมากกว่าเดิม ไม่ว่าจะอันดับเว็บตกลงอย่างรวดเร็ว หรือหน้าเว็บไม่ได้ถูกเข้าเกณฑ์การจัดอันดับบนหน้าผลการค้นหา ซึ่งสิ่งเหล่านี้จะเกิดขึ้นได้ยากมาก ถ้าเว็บไม่ได้จงใจไปคัดลอกเนื้อหามาจากเว็บไซต์อื่น ๆ รวมไปถึงการไม่อ้างอิงหรือใส่แหล่งที่มาให้เครดิตกับเว็บต้นฉบับ (ในกรณีที่ Google รู้ว่าเว็บใดเป็นแหล่งที่มาหรือต้นฉบับ)
วิธีป้องกันปัญหา Duplicate content
การเกิด Duplicate content สามารถเกิดขึ้นได้จากหลายสาเหตุตามบทความข้างต้นที่กล่าวไว้ และสามารถส่งผลกระทบต่อการทำ SEO ของเว็บไซต์นั้นได้โดยตรง จนทำให้เว็บถูกลดอันดับหรือมีบทลงโทษจากทาง Google ดังนั้นการรู้วิธีป้องกันปัญหานี้เป็นสิ่งที่สำคัญมากสำหรับผู้ที่ต้องการให้เว็บไซต์ของตนเองประสบความสำเร็จในด้าน SEO โดยวิธีป้องกันปัญหาเนื้อหาซ้ำกันมีดังนี้
ตรวจสอบเนื้อหาที่มี URL ใกล้เคียงกัน (เว็บไซต์ e-commerce)
สำหรับเว็บไซต์ที่มี URL ใกล้เคียงกันหลาย ๆ หน้าเว็บเพจอย่างเว็บไซต์ E-commerce หรือหน้าสินค้าที่หลากหลาย อาจจะมีการสร้างเนื้อหาประกอบสินค้าที่มีความคล้ายคลึงกัน ซึ่งการตรวจสอบให้แน่ใจว่าไม่ได้มีการสร้างหน้าสินค้าหรือเนื้อหาสินค้าที่ซ้ำกันหรือทับซ้อนกัน ก็เป็นหนึ่งในวิธีป้องกันปัญหาเนื้อหาซ้ำกันที่ดีที่สุด โดยการลองไล่เช็กตาม URL สินค้าที่เหมือนกัน และตรวจสอบเนื้อหาประกอบว่ามีเนื้อหาที่ซ้ำกันหรือไม่ ?
ยกตัวอย่างเช่น หากคุณมีสินค้าเสื้อยืดสีขาว 2 แบรนด์ในเว็บเดียว ควรจะมีเนื้อหาประกอบภาพสินค้าที่แตกต่างกันอย่างชัดเจน ไม่ควรคัดลอกเนื้อหาสินค้าจากแบรนด์หนึ่งไปยังอีกแบรนด์หนึ่งอย่างเด็ดขาด
สร้างเนื้อหา (Content) ในแบบของตนเอง
หนึ่งในวิธีป้องกันปัญหา Duplicate content ที่มีประสิทธิภาพที่สุด และไม่ยุ่งเกี่ยวกับเว็บไซต์ใด คือการสร้างเนื้อหา (Content) ในรูปแบบของตนเอง หรือที่เรียกกันว่า Original Content ไม่ว่าจะเป็นการโพสลงสื่อโซเชียลมีเดีย หรือการเขียนโฆษณาในเว็บไซต์อื่นเพื่อทำ Backlink มายังเว็บตัวเอง โดยตัวเนื้อหาอาจจะมีการอ้างอิงถึงที่มาของข้อมูล แต่ไม่ควรนำข้อมูลที่นำมาใช้หรือใส่เนื้อหาข้อความลงไปแบบดิบ ๆ (แบบไม่มีการเปลี่ยนแปลงหรือปรับปรุงข้อความใด ๆ ) ควรทำการเปลี่ยนแปลง หรือที่เรียกว่า Rewrite ให้เนื้อหาแตกต่างกัน ด้วยการทำแบบนี้จะทำให้คุณมั่นใจได้ทันทีว่าเว็บไซต์จะได้เนื้อหาที่ไม่ซ้ำกับใครหรือซ้ำกับตัวเองแน่นอน และป้องกันปัญหาเนื้อหาซ้ำไปได้แน่นอน
ตรวจสอบให้แน่ใจว่าเว็บไซต์เปลี่ยนเส้นทางถูกต้อง (Redirect)
สำหรับเว็บไซต์ที่อยู่มานาน อาจมีการเปลี่ยนเส้นทาง หรือสร้างหน้าเว็บใหม่สำหรับเนื้อหาเก่า ๆ ขึ้นมา การตรวจสอบโครงสร้าง URL ก็สำคัญเช่นกัน เพราะบางครั้งคุณอาจไม่ได้มีเพียงแค่หน้าเว็บเพจเดียวกันหลายเวอร์ชัน แต่ยังมีหน้าเว็บไซต์เดียวหลายแบบที่มีเนื้อหาเหมือนกันหมด
- https://www.yoursite.com (HTTPS, www)
- https://yoursite.com (HTTPS, non-www)
- http://www.yoursite.com (HTTP, www)
- http://yoursite.com (HTTP, non-www)
ยกตัวอย่างเช่น เมื่อเว็บไซต์ของคุณมีเวอร์ชัน “www” และเปลี่ยนเส้นทางไปยังเวอร์ชัน “ไม่มี www” (หรือในทางกลับกัน) กรณีนี้อาจเกิดขึ้นได้หากคุณเปลี่ยนเว็บไซต์ของคุณไปใช้ HTTPS และไม่ได้เปลี่ยนเส้นทางไซต์ HTTP ตัว URL แบบเดิมยังคงปรากฏให้เห็นและเข้าถึงได้ และมีเนื้อหาไปซ้ำกัน URL ใหม่ ดังนั้นตรวจสอบให้แน่ใจว่าเว็บไซต์ทั้งหมดที่มี URL ใกล้เคียงหรือมีการเปลี่ยนเส้นทางนั้นถูกต้อง โดยการใช้งาน Redirect 301 เพื่อไม่ให้เหลือหน้าเว็บที่มีเนื้อหาเดียวกันปรากฏซ้อนทับให้ Google พบเห็น
ใช้งาน Canonical Tag
การใช้งาน Canonical Tag เป็นตัวบ่งบอกกับเครื่องมือค้นหาอย่าง Google ว่าหน้าเว็บไหนเป็นหน้าเว็บหลัก และหน้าเว็บไหนเป็นหน้าเว็บรองที่มีเนื้อหาซ้ำกัน (สำหรับเว็บไซต์ E-commerce ที่มีเนื้อหาประกอบสินค้าซ้ำกัน และมีเนื้อหาซ้ำกันเยอะ) ซึ่งการใช้งาน Canonical Tag จะช่วยป้องกันการเข้าถึงเนื้อหาเดิมที่ยังคงอยู่ และพุ่งเป้าไปที่หน้าเว็บหลักแต่เพียงอย่างเดียว โดยการใส่ Canonical Tag (rel=”canonical) ไปที่หน้าเว็บที่มีเนื้อหาซ้ำกัน และเป็นหน้าเว็บหลัก ที่ต้องการให้ Google เห็นและนำไปจัดอันดับเว็บไซต์
บทสรุป Duplicate content เนื้อหาที่ซ้ำกันได้บนโลกอินเทอร์เน็ต
Duplicate content หรือ “เนื้อหาซ้ำกัน” คือ การที่มีเนื้อหาเดียวกันปรากฏบนหลาย URL หรือหลายเว็บไซต์ โดยไม่ได้มีการเปลี่ยนแปลงแต่อย่างใด การมีเนื้อหาซ้ำกันเป็นปัญหาอย่างหนึ่งที่ส่งผล กระทบต่อการทำ SEO เพราะมันทำให้เครื่องมือค้นหาอย่าง Google สับสนว่าเว็บใดกันแน่ที่เป็นเจ้าของเนื้อหา หรือต้นฉบับ และไม่รู้ว่าจะนำเว็บใดมาแสดงบนหน้าผลการค้นหา (SERP) จนนำไปสู่การลดอันดับเว็บทั้งหมดที่มีเนื้อหาซ้ำกัน หรือร้ายแรงสุดคือบทลงโทษยกเลิกการจัดอันดับของเว็บไซต์ ดังนั้นการรู้และเข้าใจความหมาย รวมไปถึงวิธีการป้องกันปัญหาเนื้อหาซ้ำกัน เป็นสิ่งที่ขาดไม่ได้กับเว็บไซต์ที่ทำ SEO และต้องการประสบความสำเร็จ เพราะเนื้อหา (Content) เป็นเหมือนดั่งแกนกลางในการประสบความสำเร็จในทุก ๆ เรื่อง โดยเฉพาะอย่างยิ่งการทำ SEO