feedburner
Enter your email address:

Delivered by FeedBurner

feedburner count

เจาะลึก วิเคราะห์ การทำงานของ google pagerank ดัชนีวัดความนิยมเว็บไซต์

Labels:



Page Rank เป็นชื่อเครื่องหมายการค้าของ Google คือวิธีการวัดความสำคัญของเว็บเพจนับล้านๆเว็บเพจบนอินเตอร์เน็ตด้วยระบบ Algorithm โดยมีตัวเลขตั้งแต่ 0 ถึง 10 ยิ่งตัวเลขยิ่งสูง PageRank ก็ยิ่งสูง นั่นหมายความว่าเว็บไซต์นั้นๆมีโอกาสได้รับการจัดอันดับที่ดีกว่าเว็บไซต์ที่มี PageRank ต่ำกว่าโดยสามารถทราบค่า PR ของเว็บไซต์เราได้ โดย download และ install google toolbar (http://toolbar.google.com/) หลังจากนั้นจะสามารถดูคะแนน PR ของหน้าเว็บเพจที่เราไปเยี่ยมชมได้อย่างสะดวก หรือจะเช็คค่าผ่านเว็บไซต์ต่างๆที่ให้บริการตรวจสอบค่า page rank


ประวัติของ PageRank
PageRank ได้ถูกคิดค้นและพัฒนาขึ้นที่มหาวิทยาลัย Stanford โดย Larry Page และ Sergey Brin ซึ่งเป็นโครงงานวิจัยร่วมชนิดใหม่เกี่ยวกับ search engine โดยได้เริ่มโครงงานขึ้นในปี 1995 และได้นำไปสู่ตัวต้นแบบที่มีชื่อว่า Google ในปี 1998 จากนั้นมาทั้งสองคนได้ก่อตั้งบริษัท Google Inc. ขึ้น PageRank เป็นหนึ่งในองค์ประกอบที่สำคัญมากที่ใช้จัดอันดับความนิยมจากการค้นหา และได้กลายมาเป็นส่วนหนึ่งของ web search tools ในที่สุด

ระบบวิธีการคิดและประมวลผล Algorithm
PageRank คือระบบการกระจายของความน่าจะเป็นจากการสุ่ม click ของแต่ละหน้าเพจ

นั้นๆ และจะถูกนำมาคำนวณเพื่อแบ่งเป็นเกณฑ์และเก็บรวมรวมเอาไว้ โดยค่าจะอยู่ระหว่าง 0 ถึง 1 ตัวอย่างเช่น
สมมติว่ามีหน้าเว็บเพจอยู่ 4 หน้าคือ A B C และ D ค่าเริ่มต้นของ PageRank ในแต่ละหน้าจะถูกแบ่งเป็น 0.25 เท่าๆกัน และถ้าหน้า B C D ต่างก็มี link ไปยังหน้า A ค่า PageRank ของหน้า A ขณะนั้นจะเป็น 0.75 ซึ่งคิดได้จากสมการดังนี้

ต่อจากนั้น หน้า B มี link ไปยังหน้า C และ หน้า D มี link ไปยังทั้ง 3 หน้า ซึ่งค่า link-vote ของแต่ละตัวจะถูกหารด้วยจำนวน outbound link (ลิงค์ที่ออกไปข้างนอก) ดังนั้น หน้า B จะส่งค่า vote= 0.125 ไปยังทั้งหน้า A และ C ยกเว้นหน้า D ที่จะส่งค่า vote=0.083 ไปยังทั้ง 3 หน้าดังนี้

ดังนั้นค่า PageRank ของ A = 0.125+0.25+0.083 = 0.4583

ถ้าหากว่าเราแทน outbound link ด้วย L จะได้เป็นสมการทั่วไป ดังนี้

หรือ PageRank ในแต่ละหน้าเพจ u ก็คือ


แต่ Google ไม่ได้คิดค่า PageRank เป็นเพียงสมการเชิงเส้น ธรรมดาดังที่เห็นจากข้างบน แต่จะมีค่า damping factor (d) เข้ามาเกี่ยวข้องด้วย โดยจะถูกนำมาลบออกจากค่า 1 ซึ่งค่า d นี้เองที่ยังเป็นปริศนาความลับของ Google และเขียนสมการได้ดังนี้


หรือถ้า N คือจำนวนหน้าทั้งหมดที่เก็บได้ จะได้สมการคือ




ดังนั้นจะเห็นได้ว่า ค่าของ PageRank ในแต่ละหน้าจะขึ้นอยู่กับค่า outbound link ที่มาจากหน้าอื่นๆ และถ้าหน้านั้นมีค่า PR สูงอยู่แล้วก็จะทำให้หน้าเพจที่ได้ link เข้ามามีค่าสูงตามไปด้วย แต่ถ้าสังเกตุให้ดีจะเห็นว่าถึงแม้ได้รับค่า vote จากหน้าเพจที่มี PR สูง มากๆนั้นดี แต่ถ้าจำนวน link ที่เข้ามามากๆจากหน้าเดิมๆก็จะทำให้ค่า PR ในหน้าเพจต่ำลงได้ อันนี้นี่เองเป็นกลไกที่ Google ต้องการให้มีการกระจายค่าความนิยมมาจากหลายๆเว็บไซต์ ไม่ใช่มาจากหน้าใดหน้าหนึ่งเท่านั่นครับ

ในการเก็บข้อมูลในแต่ละหน้านั้น Google จะมีเจ้าตัวไต่ที่เรียกว่า crawls เข้าไปทำการเก็บข้อมูล และการปรับค่าคะแนน PR ก็จะเปลี่ยนไปเรื่อยๆ ถ้าหากว่าหน้าเว็บเพจนั้นไม่มี link ที่เข้ามา (outbound link) เลย ก็จะทำให้ค่า PR ลดลงได้เช่นกัน เพราะฉนั้นรูปของสมการทั่วๆไปเขียนได้เป็น
เมื่อ p คือแต่ละหน้าของเว็บเพจ, M คือกลุ่มทั้งหมดของหน้าเว็บเพจ, N คือจำนวนทั้งหมดของหน้าเว็บเพจ

จากสูตรที่ Google ได้คิดค้นขึ้นและนำมาใช้เพื่อจัดแยกอันดับในแต่ละหน้าของเว็บไซต์ ก็เพื่อที่จะส่งผลต่อการค้นหา และให้ได้ผลลัพธ์ออกมาดีที่สุด และคงจะพูดได้ว่า PageRank เป็นหัวใจที่สำคัญในการทำ SEO สำหรับเว็บมาสเตอร์มือใหม่ทั้งหลายนั่นเองครับ

ที่มา : wikipidia.org





0 comments:

Post a Comment

PURI Tech-Money Online for blogger