Awesome Semantic-Search

logo इनके द्वारा निर्मित @createdbytango.

निम्नलिखित रिपॉजिटरी का उद्देश्य सिमेंटिक सर्च और सिमेंटिक समानता से संबंधित कार्यों के लिए मेटा-रिपॉजिटरी की सेवा करना है।

सिमेंटिक सर्च टेक्स्ट तक ही सीमित नहीं है! यह छवियों, भाषण, आदि के साथ किया जा सकता है। इसलिए अर्थपूर्ण खोज के कई अलग-अलग उपयोग-मामले और अनुप्रयोग हैं।

Contributions / Milestones

कार्य सूची के लिए प्रोजेक्ट बोर्ड पर एक नज़र डालें

विषय-सूची

दस्तावेज़
- 2014
- 2015
- 2016
- 2017
- 2018
- 2019
- 2020
- 2021
लेख
Libraries तथा Tools
डेटासेट
माइलस्टोन्स

दस्तावेज़

2010

प्राथमिकता रेंज पेड़ 📄

2014

सूचना पुनर्प्राप्ति के लिए कनवल्शनल-पूलिंग स्ट्रक्चर के साथ एक अव्यक्त सिमेंटिक मॉडल 📄

2015

स्किप-थॉट वैक्टर 📄
कोणीय दूरी के लिए व्यावहारिक और इष्टतम एलएसएच 📄

2016

कुशल पाठ वर्गीकरण के लिए ट्रिक्स का बैग 📄
सबवर्ड जानकारी के साथ वर्ड वैक्टर को समृद्ध करना 📄
पदानुक्रमित नेविगेट करने योग्य लघु विश्व ग्राफ़ का उपयोग करके कुशल और मजबूत अनुमानित निकटतम पड़ोसी खोज
लगभग समान शब्द एंबेडिंग की खोज पर
बिना लेबल वाले डेटा से वाक्यों के वितरित अभ्यावेदन सीखना 📄
उच्च आयामी डेटा पर अनुमानित निकटतम पड़ोसी खोज --- प्रयोग, विश्लेषण और सुधार

2017

प्राकृतिक भाषा अनुमान डेटा से सार्वभौमिक वाक्य अभ्यावेदन की पर्यवेक्षित शिक्षा 📄

2018

यूनिवर्सल सेंटेंस एनकोडर 📄
बातचीत से सिमेंटिक टेक्स्टुअल समानता सीखना 📄
Google AI ब्लॉग: सिमेंटिक टेक्स्टुअल समानता में प्रगति 📄
उच्च-आयामी डेटा में निकटता खोज के लिए k-निकटतम पड़ोसी ग्राफ़ के आधार पर अनुक्रमण का अनुकूलन
नेविगेटिंग स्प्रेडिंग-आउट ग्राफ के साथ तेजी से अनुमानित निकटतम पड़ोसी खोज
सीखा सूचकांक संरचनाओं के लिए मामला

2019

लेजर: भाषा अज्ञेय वाक्य प्रतिनिधित्व 📄
प्रश्न भविष्यवाणी द्वारा दस्तावेज़ विस्तार 📄
सेंटेंस-बर्ट: स्याम देश के बर्ट-नेटवर्क का इस्तेमाल करते हुए वाक्य एम्बेडिंग 📄
बर्ट के साथ बहु-स्तरीय दस्तावेज़ रैंकिंग 📄
कमजोर पर्यवेक्षित खुले डोमेन प्रश्न उत्तर के लिए गुप्त पुनर्प्राप्ति
BERTserini के साथ एंड-टू-एंड ओपन-डोमेन प्रश्न उत्तर
बायोबर्ट: बायोमेडिकल टेक्स्ट माइनिंग के लिए एक पूर्व-प्रशिक्षित बायोमेडिकल भाषा प्रतिनिधित्व मॉडल📄
नरम निकटतम पड़ोसी नुकसान के साथ प्रतिनिधित्व का विश्लेषण और सुधार📸
DiskANN: एक ही नोड पर तेजी से सटीक अरब-बिंदु निकटतम पड़ोसी खोजें

2020

COVID-19 ओपन रिसर्च डेटासेट के लिए एक तंत्रिका खोज इंजन को तेजी से तैनात करना: प्रारंभिक विचार और सीखे गए सबक 📄
बर्ट के साथ पैसेज री-रैंकिंग 📄
सह-खोज: अर्थपूर्ण खोज के साथ COVID-19 सूचना पुनर्प्राप्ति, प्रश्न उत्तर, और सार संक्षेप 📄
LaBSE:Language-agnostic BERT Sentence Embedding 📄
Covidex: COVID-19 ओपन रिसर्च डेटासेट के लिए न्यूरल रैंकिंग मॉडल और कीवर्ड सर्च इंफ्रास्ट्रक्चर 📄
DeTect: बुद्धिमान पाठ समझ के लिए एक गहन एनएलपी ढांचा 📄
ज्ञान आसवन का उपयोग करके एकभाषी वाक्य एम्बेडिंग बहुभाषी बनाना 📄
टेक्स्ट रैंकिंग के लिए पूर्व प्रशिक्षित ट्रांसफॉर्मर: बीईआरटी और परे 📄
REALM: पुनर्प्राप्ति-संवर्धित भाषा मॉडल पूर्व-प्रशिक्षण
इलेक्ट्रा: प्री-ट्रेनिंग टेक्स्ट एनकोडर जेनरेटर के बजाय डिस्क्रिमिनेटर के रूप में होते हैं📄
एयरबीएनबी खोज के लिए डीप लर्निंग में सुधार
Airbnb खोज में विविधता का प्रबंधन📄
सघन पाठ पुनर्प्राप्ति के लिए लगभग निकटतम पड़ोसी नकारात्मक विपरीत शिक्षा📄

2021

तमिल शब्दों के बीच अर्थ समानता गणना के लिए हाइब्रिड दृष्टिकोण📄
संवर्धित SBERT 📄
BEIR: सूचना पुनर्प्राप्ति मॉडल के शून्य-शॉट मूल्यांकन के लिए एक विषम बेंचमार्क 📄
संगतता-जागरूक विषम दृश्य खोज 📷
कुछ उदाहरणों से व्यक्तिगत शैली सीखना📷
TSDAE: अनसुपरवाइज्ड सेंटेंस एंबेडिंग लर्निंग के लिए ट्रांसफॉर्मर-आधारित अनुक्रमिक डीनोइज़िंग ऑटो-एनकोडर का उपयोग करना📄
ट्रांसफॉर्मर का एक सर्वेक्षण📄📷
डीप सुदृढीकरण लर्निंग का उपयोग करके उच्च गुणवत्ता से संबंधित खोज क्वेरी सुझाव
Taobao खोज में एम्बेडिंग-आधारित उत्पाद पुनर्प्राप्ति📄📷
टीपीआरएम: वेब खोज के लिए एक विषय-आधारित निजीकृत रैंकिंग मॉडल📄
mMARCO: एमएस मार्को पैसेज रैंकिंग डेटासेट का एक बहुभाषी संस्करण📄
टेक्स्ट पर डेटाबेस रीजनिंग
एडवरसैरियल फाइन-ट्यूनिंग BERT को कैसे लाभ पहुंचाता है?📄
ट्रेन शॉर्ट, टेस्ट लांग: रैखिक पूर्वाग्रहों के साथ ध्यान इनपुट लेंथ एक्सपेरिमेंटेशन को सक्षम बनाता है📄
प्राइमर: भाषा मॉडलिंग के लिए कुशल ट्रांसफॉर्मर की खोज📄
वह ध्वनि कितनी परिचित है? ध्वनिक शब्द एम्बेडिंग का क्रॉस-लिंगुअल रिप्रेजेंटेशनल समानता विश्लेषण🔊
SimCSE: वाक्य एम्बेडिंग की सरल विरोधाभासी शिक्षा📄
रचनात्मक ध्यान:खोज और पुनर्प्राप्ति को अलग करना📄📷
स्पैन: अत्यधिक कुशल अरब पैमाने पर लगभग निकटतम पड़ोसी खोज

लेख

अर्थपूर्ण खोज से निपटना
Azure Congnitive Search में सिमेंटिक सर्च
हमने अपनी खोज को 10x स्मार्ट बनाने के लिए सिमेंटिक खोज का उपयोग कैसे किया
दोहरे स्थान वाले शब्द एम्बेडिंग के साथ सिमेंटिक सर्च इंजन का निर्माण
FAISS+SBERT के साथ अरब-पैमाने की सिमेंटिक समानता खोज
समानता खोज थ्रेसहोल्ड के बारे में कुछ टिप्पणियां
स्थानीयता संवेदनशील हैशिंग का उपयोग करके डुप्लिकेट छवि खोज के पास
वेक्टर समानता खोज और फैस पर नि: शुल्क पाठ्यक्रम
निकटतम पड़ोसियों के एल्गोरिदम के लिए व्यापक गाइड

Libraries तथा Tools

fastText
Universal Sentence Encoder
SBERT
LaBSE
LASER
Haystack
Jina.AI
SentEval Toolkit
BEIR :Benchmarking IR
Which Frame?
PySerini
milvus
weaviate
natural-language-youtube-search
same.energy
scaNN
annoy
faiss
DPR
rank_BM25
nearPy
vearch
PyNNDescent
pgANN
Tensorflow Similarity
opensemanticsearch.org
GPT3 Semantic Search
searchy
txtai
HyperTag
vectorai
embeddinghub
AquilaDb

डेटासेट

सिमेंटिक टेक्स्ट समानता डेटासेट हब
फेसबुक एआई छवि समानता चुनौती
WIT: विकिपीडिया-आधारित छवि पाठ डेटासेट

माइलस्टोन्स

कार्य सूची के लिए परियोजना बोर्ड पर एक नज़र डालें ताकि किसी भी खुले मुद्दे में योगदान किया जा सके।

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_Hindi.md

README_Hindi.md

Awesome Semantic-Search

Contributions / Milestones

विषय-सूची

दस्तावेज़

2010

2014

2015

2016

2017

2018

2019

2020

2021

लेख

Libraries तथा Tools

डेटासेट

माइलस्टोन्स

Files

README_Hindi.md

Latest commit

History

README_Hindi.md

File metadata and controls

Awesome Semantic-Search

Contributions / Milestones

विषय-सूची

दस्तावेज़

2010

2014

2015

2016

2017

2018

2019

2020

2021

लेख

Libraries तथा Tools

डेटासेट

माइलस्टोन्स