نیچرل لینگویج پروسیسنگ، بنیادی اصطلاحات

NLP یا نیچرل لینگویج پروسیسنگ، کمپیوٹرز کو انسانی زبان کو سمجھنے، تشریح کرنے اور تخلیق کرنے کے قابل بنانے کے لیے استعمال کی جانے والی تکنیکوں اور طریقوں کی ایک رینج پر مشتمل ہے۔ یہاں کچھ بنیادی اصطلاحات ہیں جو عام طور پر NLP میں استعمال ہوتی ہیں.

ٹوکنائزیشن:Tokenization: متن کو چھوٹی اکائیوں میں توڑنے کا عمل، جسے ٹوکن کہتے ہیں، جیسے الفاظ، جملے یا حروف۔ ٹوکنائزیشن NLP تجزیہ میں بنیادی قدم ہے۔

پارٹ آف اسپیچ (POS) ٹیگنگ:Part-of-Speech (POS) Tagging: کسی جملے میں الفاظ کو گرائمیکل ٹیگ تفویض کرنے کا عمل، جیسے اسم، فعل، صفت وغیرہ۔ POS ٹیگنگ کسی جملے کی نحوی ساخت اور معنی کو سمجھنے میں مدد کرتی ہے۔

نام شدہ ہستی کی شناخت (NER):Named Entity Recognition (NER) متن میں نامزد اداروں کی شناخت اور درجہ بندی کرنے کا کام، جیسے لوگوں، تنظیموں، مقامات، تاریخوں وغیرہ کے نام۔ NER معلومات نکالنے اور اداروں کے درمیان تعلقات کو سمجھنے کے لیے مفید ہے

جذباتی تجزیہ:Sentiment Analysis: متن کے ایک ٹکڑے میں بیان کردہ جذباتی لہجے یا جذبات کا تعین کرنے کا عمل۔ اس میں متن کو مثبت، منفی، یا غیر جانبدار کے طور پر درجہ بندی کرنا، کسی خاص موضوع پر رائے عامہ یا جذبات کا اندازہ لگانے میں مدد کرنا شامل ہے۔

ورڈ ایمبیڈنگز:Word Embeddings: الفاظ کو ایک اعلیٰ جہتی جگہ میں گھنے ویکٹر کے طور پر پیش کرنے کے لیے استعمال ہونے والی تکنیکیں، الفاظ کے درمیان معنوی رشتوں کو حاصل کرتی ہیں۔ ورڈ ایمبیڈنگ کے مقبول ماڈلز میں Word2Vec، GloVe، اور FastText شامل ہیں۔

متن کی درجہ بندی:Text Classification متن کو اس کے مواد کی بنیاد پر پہلے سے طے شدہ کلاسوں یا زمروں میں درجہ بندی کرنے کا کام۔ یہ عام طور پر جذبات کے تجزیہ، موضوع کی درجہ بندی، اسپام کا پتہ لگانے اور مزید کے لیے استعمال ہوتا ہے۔

 مشینی ترجمہ:Machine Translation: ایک زبان سے دوسری زبان میں متن کا خود بخود ترجمہ کرنے کا عمل۔ مشینی ترجمہ کے نظام مختلف زبانوں میں جملوں کی ساخت اور معنی کو سمجھنے کے لیے NLP تکنیک کا استعمال کرتے ہیں.

معلومات کی بازیافت:Information Retrieval: صارف کے سوالات کی بنیاد پر غیر ساختہ ٹیکسٹ دستاویزات کے ایک بڑے ذخیرے سے متعلقہ معلومات کو بازیافت کرنے کی مشق۔ مطلوبہ الفاظ کی مماثلت، دستاویز کی درجہ بندی، اور متعلقہ اسکورنگ جیسی تکنیکیں استعمال کی جاتی ہیں۔

چیٹ بوٹس:Chatbots: Computer program کمپیوٹر پروگرام جو انسانی گفتگو کو نقل کرنے کے لیے بنائے گئے ہیں۔ NLP تکنیکوں کا استعمال صارف کے سوالات کو سمجھنے، مناسب جوابات پیدا کرنے اور بات چیت کے باہمی تجربات فراہم کرنے کے لیے کیا جاتا ہے۔

 ٹیکسٹ جنریشن:Text Generation مشین لرننگ تکنیک کا استعمال کرتے ہوئے انسان جیسا متن بنانے کا عمل۔ یہ سادہ اصول پر مبنی ٹیمپلیٹس سے لے کر اعلی درجے کے ڈیپ لرننگ ماڈلز، جیسے زبان کے ماڈل جیسے GPT تک ہو سکتا ہے۔