دليلك المختصر لفهم الـ TF-IDF ودورها في التغلب على المنافسين

محتوى المقالة

علينا أن نعترف ! جميعًا فعلناها ولو مرة واحدة مع محرك البحث، نكتب كلمات عشوائية ليست لها علاقة ببعضها البعض، ثم نتوقع أن يأتى لنا جوجل بما نبحث عنه تحديدًا، والمفاجأة إنه يفعل هذا حقًا! ربما تكون كلمات أغنية عشوائية، ربما كلمات من مشهد في فيلم ما، ربم أجزاء من وصفة طعام لا نتذكرها، وربما أشياء أخرى أقل أهمية أو ربما ليست لها قيمة على الإطلاق، وبرغم ذلك ينجح جوجل في كل مرة في إيجاد النتيحة الصحيحة لبحثنا! كيف؟! هل تساءلت يومًا عن ذلك؟

ما المقصود بالـ TF-IDF؟ وكيف يعمل؟ 

 كيف وصل محرك البحث إلى هذا النوع من الذكاء؟ كيف استطاع الإستدلال بالكلمات العشوائية على الموضوعات ذات صلة؟! 

  • الإجابة عزيزي القارئ تكمن في معامل إحصائي هام يسمى بالـ TF-IDF. 
  • الإجابة غير واضحة بعد؟! دعنا إذا نساعدك على  فهم ما يعنيه وما أهميته للعاملين في مجال الـ SEO؟ 

معامل الـ TF-IDF هو معامل إحصائي يتم استخدامه من قبل خوارزميات جوجل؛ وهو إختصار لـ Term Frequency-Inverse Document Frequency، أى معدل تكرار الكلمة الواحدة في المستند الواحد، مقابل معدل ظهور المستندات التي تحتوي على نفس الكلمة.

الـ TF-IDF ما هو إلا نموذج تحليل نصى تلجأ إليه خوارزميات جوجل للتعرف على أبعد ما وراء الكلمة المفتاحية. فعندما تحلل هذه الخوارزميات نصًا أو مقالة ما، فهى لا تركز فقط في الموضوع الرئيسي لها، بل تحاول معرفة أى من الكلمات ذات صلة دلالية بالموضوع … كم معدل تكرار ظهورها بنسبة لموضوعات أخرى…

كيف تم الربط بين هذه الموضوعات المختلفة؟ بحيث تستشفى مدى أهميتها لهذه الموضوعات،  وتستغل هذه الأهمية في تحسين نتائج محركات البحث والوصول إلى نتائج أكثر صلة وتحديدًا لرغبات المستخدم. 

لكن كيف يعمل هذا الأمر بالتفصيل؟! دعني أبسط لك الأمر  بتناول شقي المعامل بالتفصيل: 

  •  TF:  وهي إختصارًا  للـ Term Frequency ويقصد بها العملية التي يتم فيها حساب معدل تكرار كلمة في النص أو المستند الواحد، فإذا قلنا مثلًا أن هناك نصًا يرغب جوجل في تحليله، ويضم هذه الجملة: 

يستخدم الزيادى في وصفات الوجه والشعر

هنا سيقوم جوجل بتقسيم هذه الجملة إلى كلمات منفردة، ويتجاهل في ذلك كل من حروف الجر والحروف الزائدة، بحيث يتم تحليل الجملة كالآتي: 

يستخدم        الزبادي       وصفات        الوجه      الشعر 

دليلك المختصر لفهم الـ TF-IDF ودورها في التغلب على المنافسين
دليلك المختصر لفهم الـ TF-IDF ودورها في التغلب على المنافسين

هنا سنتعامل مع النص كونه يتكون من جملة واحدة فقط، وعند تحليلها سنجد إن كل من الكلمات السابقة تكرر مرة واحدة، إما إذا كانت هذه الجملة عبارة عن جزء من مقالة كبيرة تتكون من العديد من الجمل والكلمات، فهنا سيتم حساب معدل تكرار الكلمة من خلال المعادلة الآتية: 

معدل التكرار Term Frequency =  معدل تكرار الكلمة في النص  /   عدد كلمات النص الكلية. 

فإذا قلنا إن كلمة زبادى مثلًا تتكرر في النص بمعدل 50 مرة، وعدد كلمات النص الكلية 500، فهنا  الـ  FT ستكون خارج قسمة الـ 50 على الـ 500، بحيث يكون الناتج هو 0.1

  • IDF: هو إختصار للـ Inverse Document Frequency ويقصد به معدل ظهور الكلمة بالنسبة لمجموعة من المستندات أو النصوص المختلفة؛ بحيث يختلف هذا المصطلح عن سابقه، في كوننا هنا لا نركز على معدل تكرار الكلمة في النص الأصلي فقط، بل تقوم الخوارزمية بتحليل ظهورها في مقالات ونصوص أخرى ليست بضرورة متشابهة،
  • ثم تخرج بنتيجة حول العلاقات الدلالية لهذه الكلمة والمواضيع المتعلقة بها فمثلًا إذا طبقنا نفس المثال السابق على مجموعة من الموضوعات المختلفة كالـ :الجمال، الصحة،  الشعر، وصفات الطعام، الدايت،  الهندسة، المعمار، التصميم، سنجد مثلًا إن كلمة زبادى تكررت في 5 موضوعات من أصل 7، ولكى يتم إحتساب معدل الـ IDF بطريقة صحيحة،  تقوم الخوارزمية بتطبيق المعادلة الآتية: 

معدل الظهور IDF= عدد النصوص الكلية / عدد النصوص التي ظهرت بها الكلمة

  بحيث يكون الناتج هو محصلة قسمة 7 ( عدد النصوص أو الموضوعات التي يتم التطبيق عليها) /  5 ( عدد النصوص التي ظهرت بها الكلمة المنشودة)، وهو 1.4, 

بإستخراج كل من معدل تكرار الكلمة في النص، وكذلك معدل ظهور الكلمة بالنسبة للنصوص الأخرى، تتمكن الخوارزمية من معرفة مدى أهميتها وارتباطها بالموضوعات من غير تطبيق المعادلة الآتية: 

TF-IDF= TF * IDF  

أي 

حاصل ضرب معدل تكرار الكلمة في النص الواحد  في معدل ظهورها في النصوص المختلفة 

إذا قمنا بتطبيقها في المثال السابق ستكون قيمة كلمة زيادي = 0.1 في 1,4 = 0.14 وبمقارنتها بباقي الكلمات في النص، ستقوم الخوارزمية بإنشاء مصفوفة ذكية  يتم ترتيب الكلمات فيها حسب قيمتها المستخرجة ودلالتها بالنسبة للموضوع، ثم الخروج بإقتراحات ذكية وأكثر دلالة وتحديدًا  لنتائج البحث. 

في المثال السابق، قمنا بتطبيق شرح مبسط لألية عمل الـ TF-IDF في خوارزميات البحث، لكن هذه العملية تتسم بكثير من التعقيد والضخامة كونها تتعامل مع ملايين النتائج في الثانية الواحدة وعدد مأهول من تكرارات ومعدلات الظهور، لكن هذه العملية في مجملها لا تخرج عن 5 مراحل أساسية تمر بها الكلمات كالآتي: 

  1. مرحلة تهيئة النص: وهي بتنقيح النص من كافة الكلمات و الحروف الزائدة 
  2. مرحلة فصل النص: وهو بتقسيم الجمل والعبارات إلى كلمات منفردة والتعامل مع كل كلمة على حدى. 
  3. مرحلة حساب معدل التكرار: وذلك بتطبيق معدلة الـ TF
  4. مرحلة حساب معدل الظهور : وذلك بتطبيق معادله الـ IDF 
  5. مرحلة حساب معامل الـ TF-IDF بضرب كل من معدل تكرار الكلمة الواحدة في النص في معدل تكرار ظهورها في الصفحات المختلفة. 
دليلك المختصر لفهم الـ TF-IDF ودورها في التغلب على المنافسين
كيف يعمل الـ td-ifd

اقرأ ايضا: أفضل إضافات السوشيال ميديا للوردبريس

ما أهمية الـ TF-IDF  للعاملين في مجال الـ  SEO؟ 

تتطور خوارزميات جوجل يومًا بعد اليوم، وهذا التطور يطرأ عليه العديد من التغيرات في طريقة تصدر النتائج، فموقعك المتصدر الآن، قد يتسبب تحديث جديد إلى مغادرته للصفحة الأولى تمامًا؛ لذلك يجب على العامل في مجال الـ  SEO  المحترف، ألا يعتمد على تقنية واحدة أو تكتيك معين في عمله،

بل عليه أن ينوع من أسلحته، بحيث يكون مستعدًا لمواكبة كافة التطورات والتماشي معها أيضًا، فالاعتماد على التركيز على الكلمات الرئيسية ومنحها الإهتمام الأكبر في العمل ليس بالأمر الصحيح، بل عليك أن تعمل بالتوازي على استراتيجيات جانبية كـالـ TF-IDF، لماذا؟!  دعنا نوضح الأمر. 

عندما يقوم جوجل بتحليل مستند ما ويكتشف أن الموضوع (س) غالبًا ما يتعلق به مجموعة من الكلمات الدلالية، فإن هذه الكلمات تٌعامل  كمرجع أساسي لربط كافة النتائج الأخري بنفس الموضوع؛ فمثلًا إذا قلنا أن الموضوعات التي تتناول الـ  SEO غالبًا ما يصحابها كلمات تظهر وتتكرر كثيرًا  كالـ : موقع، محركات البحث، تهيئة، موقع إلكتروني، جوجل، محتوى.

فإن الخوارزميات ستقوم بربط أى صفحة تحتوى على هذه الكلمات الدلالية بالموضوع وتساعد على ظهوره على نتائج البحث، أما إذا أهملت الصفحة وجود هذا النوع من الكلمات بداخله، سيمثل هذا  عائقًا أمام خوارزميات البحث لربطها بالموضوع الأساسي. 

بالإضافة إلى ما سبق، فإن معامل الـ TF-IDF  يعمل كمسلط للضوء على الجمهور القابع خلف الكواليس؛ فينما أنت تركز اهتمامك على الكلمة الرئيسية وجمهورها المستهدف الأساسي والكلمات المترابطة بها، سيساعدك الـ TF-IDF  على معرفة جمهورك الثانوي وأى الكلمات يستخدمها في سبيل الوصول إليك، وما الكلمات الفرعية التي تولد مرور عالي بالنسبة لموقعك بدون أن تمنحها الإهتمام الكافي. 

يساعد الـ TF-IDF  على تهيئة نتائج البحث في جوجل بحيث تجعلها أكثر صلة بالموضوع التي يتم البحث عنه، وهو بدوره ما يعكس على ما تقدمه من خدمات خلال موقعك الإلكتروني؛ فكلما كنت متخصصًا فيما تقدمه من خدمات وتقوم بتغذيتها بالكلمات الدلالية المناسبة، كلما ساعد هذا في تصدرك لنتائج البحث وإظهارها كنتيجة ذات صلة مباشرة للموضوع. 

يعمل الـ TF-IDF   أيضًا على فتح المجال لمزيد من الأفكار الجديدة في كتابة محتوى مهيئ لمحركات البحث، فبينما يعرض لك المعامل مجموعة من الكلمات التي ليس لها علاقة بالموضوع الأساسي، يتمكن خبير الـ  SEO من تحليل هذه الكلمات ومعرفة علاقتها بالكلمة الأساسية للموضوع و استخراج أفكار جديدة للمحتوى منها، لم يكن ليكتشفها بالطرق العادية.

ولكى يتم ذلك بكافأة يتم اللجوء إلى مجموعة من الأدوات المجانية والمدفوعة كالأتي: 

اداة Seobility:

  • هى أدة تمنحك القدرة على معرفة أهم الكلمات الدلالية المترابطة بموضوع ما بواقع 3 محاولات مجانية للمرة الأولي دون تسجيل، وكذلك إشتراك مجاني لمدة شهر عند التسجيل، وهي بدورها تساعدك على معرفة معامل الـ TF-IDF  بسهولة، وذلك من خلال كتابة الكلمة المفتاحية وتحديد المنطقة الجغرافية المستهدفة. تدعم الأداءة العديد من خدمات الـ SEO  كما إنها تدعم عملية البحث بالعديد من اللغات منها اللغة العربية.
دليلك المختصر لفهم الـ TF-IDF ودورها في التغلب على المنافسين
دليلك المختصر لفهم الـ TF-IDF ودورها في التغلب على المنافسين

اداة tfidftool

  • أداة أخرى تساعد في حساب معدل الـ TF-IDF بسهولة، حيث تمنح مستخدميها وفرة من نتائج البحث للكلمات ذات صلة، كما إنها تمنح المستخدم القدرة على التخصص في البحث، بحيث تستخرج نتائج للكلمات مفردة أو ثنائية أو ثلاثية الإرتباط. 
دليلك المختصر لفهم الـ TF-IDF ودورها في التغلب على المنافسين
دليلك المختصر لفهم الـ TF-IDF ودورها في التغلب على المنافسين

بجانب الأدوات السابقة والتي تتعلق مباشرة بإستخراج الـ TF-IDF بسهولة، يمكن إستخراج الكلمات الدلالية أيضًا بأدوات الـ SEO الإحترافية كـ : MOZ و Semrush،وahrefsk ، حيث تمنح هذه الأدوات الخدمة من خلال مصطلحات مشابهة كالـ Keyword relevancy. 

في النهاية، فإن فهم الـ TF-IDF وتحليل  علاقتها بالكلمة المفتاحية الأساسية، يمثل نواه لإستراتيجية seo إحترافية، استراتيجية تتمكن من خلالها لا تصدر الكلمة المفتاحية المستهدفة فقط، بل زيادة عدد زيارات لموقعك كذلك. 

والأن وبعد أن فهمت كيف يجد جوجل أغنيتك المفضلة بسهولة، أطلعنا على ما يشغل بالك من أسئلة أخرى، لعلنا نجيب عليها فيما هو قادم من مقالات!

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

المقالات الأكثر قراءة