logo इनके द्वारा निर्मित @createdbytango.
निम्नलिखित रिपॉजिटरी का उद्देश्य सिमेंटिक सर्च और सिमेंटिक समानता से संबंधित कार्यों के लिए मेटा-रिपॉजिटरी की सेवा करना है।
सिमेंटिक सर्च टेक्स्ट तक ही सीमित नहीं है! यह छवियों, भाषण, आदि के साथ किया जा सकता है। इसलिए अर्थपूर्ण खोज के कई अलग-अलग उपयोग-मामले और अनुप्रयोग हैं।
कार्य सूची के लिए प्रोजेक्ट बोर्ड पर एक नज़र डालें
- कुशल पाठ वर्गीकरण के लिए ट्रिक्स का बैग 📄
- सबवर्ड जानकारी के साथ वर्ड वैक्टर को समृद्ध करना 📄
- पदानुक्रमित नेविगेट करने योग्य लघु विश्व ग्राफ़ का उपयोग करके कुशल और मजबूत अनुमानित निकटतम पड़ोसी खोज
- लगभग समान शब्द एंबेडिंग की खोज पर
- बिना लेबल वाले डेटा से वाक्यों के वितरित अभ्यावेदन सीखना 📄
- उच्च आयामी डेटा पर अनुमानित निकटतम पड़ोसी खोज --- प्रयोग, विश्लेषण और सुधार
- यूनिवर्सल सेंटेंस एनकोडर 📄
- बातचीत से सिमेंटिक टेक्स्टुअल समानता सीखना 📄
- Google AI ब्लॉग: सिमेंटिक टेक्स्टुअल समानता में प्रगति 📄
- उच्च-आयामी डेटा में निकटता खोज के लिए k-निकटतम पड़ोसी ग्राफ़ के आधार पर अनुक्रमण का अनुकूलन
- नेविगेटिंग स्प्रेडिंग-आउट ग्राफ के साथ तेजी से अनुमानित निकटतम पड़ोसी खोज
- सीखा सूचकांक संरचनाओं के लिए मामला
- लेजर: भाषा अज्ञेय वाक्य प्रतिनिधित्व 📄
- प्रश्न भविष्यवाणी द्वारा दस्तावेज़ विस्तार 📄
- सेंटेंस-बर्ट: स्याम देश के बर्ट-नेटवर्क का इस्तेमाल करते हुए वाक्य एम्बेडिंग 📄
- बर्ट के साथ बहु-स्तरीय दस्तावेज़ रैंकिंग 📄
- कमजोर पर्यवेक्षित खुले डोमेन प्रश्न उत्तर के लिए गुप्त पुनर्प्राप्ति
- BERTserini के साथ एंड-टू-एंड ओपन-डोमेन प्रश्न उत्तर
- बायोबर्ट: बायोमेडिकल टेक्स्ट माइनिंग के लिए एक पूर्व-प्रशिक्षित बायोमेडिकल भाषा प्रतिनिधित्व मॉडल📄
- नरम निकटतम पड़ोसी नुकसान के साथ प्रतिनिधित्व का विश्लेषण और सुधार📸
- DiskANN: एक ही नोड पर तेजी से सटीक अरब-बिंदु निकटतम पड़ोसी खोजें
- COVID-19 ओपन रिसर्च डेटासेट के लिए एक तंत्रिका खोज इंजन को तेजी से तैनात करना: प्रारंभिक विचार और सीखे गए सबक 📄
- बर्ट के साथ पैसेज री-रैंकिंग 📄
- सह-खोज: अर्थपूर्ण खोज के साथ COVID-19 सूचना पुनर्प्राप्ति, प्रश्न उत्तर, और सार संक्षेप 📄
- LaBSE:Language-agnostic BERT Sentence Embedding 📄
- Covidex: COVID-19 ओपन रिसर्च डेटासेट के लिए न्यूरल रैंकिंग मॉडल और कीवर्ड सर्च इंफ्रास्ट्रक्चर 📄
- DeTect: बुद्धिमान पाठ समझ के लिए एक गहन एनएलपी ढांचा 📄
- ज्ञान आसवन का उपयोग करके एकभाषी वाक्य एम्बेडिंग बहुभाषी बनाना 📄
- टेक्स्ट रैंकिंग के लिए पूर्व प्रशिक्षित ट्रांसफॉर्मर: बीईआरटी और परे 📄
- REALM: पुनर्प्राप्ति-संवर्धित भाषा मॉडल पूर्व-प्रशिक्षण
- इलेक्ट्रा: प्री-ट्रेनिंग टेक्स्ट एनकोडर जेनरेटर के बजाय डिस्क्रिमिनेटर के रूप में होते हैं📄
- एयरबीएनबी खोज के लिए डीप लर्निंग में सुधार
- Airbnb खोज में विविधता का प्रबंधन📄
- सघन पाठ पुनर्प्राप्ति के लिए लगभग निकटतम पड़ोसी नकारात्मक विपरीत शिक्षा📄
- तमिल शब्दों के बीच अर्थ समानता गणना के लिए हाइब्रिड दृष्टिकोण📄
- संवर्धित SBERT 📄
- BEIR: सूचना पुनर्प्राप्ति मॉडल के शून्य-शॉट मूल्यांकन के लिए एक विषम बेंचमार्क 📄
- संगतता-जागरूक विषम दृश्य खोज 📷
- कुछ उदाहरणों से व्यक्तिगत शैली सीखना📷
- TSDAE: अनसुपरवाइज्ड सेंटेंस एंबेडिंग लर्निंग के लिए ट्रांसफॉर्मर-आधारित अनुक्रमिक डीनोइज़िंग ऑटो-एनकोडर का उपयोग करना📄
- ट्रांसफॉर्मर का एक सर्वेक्षण📄📷
- डीप सुदृढीकरण लर्निंग का उपयोग करके उच्च गुणवत्ता से संबंधित खोज क्वेरी सुझाव
- Taobao खोज में एम्बेडिंग-आधारित उत्पाद पुनर्प्राप्ति📄📷
- टीपीआरएम: वेब खोज के लिए एक विषय-आधारित निजीकृत रैंकिंग मॉडल📄
- mMARCO: एमएस मार्को पैसेज रैंकिंग डेटासेट का एक बहुभाषी संस्करण📄
- टेक्स्ट पर डेटाबेस रीजनिंग
- एडवरसैरियल फाइन-ट्यूनिंग BERT को कैसे लाभ पहुंचाता है?📄
- ट्रेन शॉर्ट, टेस्ट लांग: रैखिक पूर्वाग्रहों के साथ ध्यान इनपुट लेंथ एक्सपेरिमेंटेशन को सक्षम बनाता है📄
- प्राइमर: भाषा मॉडलिंग के लिए कुशल ट्रांसफॉर्मर की खोज📄
- वह ध्वनि कितनी परिचित है? ध्वनिक शब्द एम्बेडिंग का क्रॉस-लिंगुअल रिप्रेजेंटेशनल समानता विश्लेषण🔊
- SimCSE: वाक्य एम्बेडिंग की सरल विरोधाभासी शिक्षा📄
- रचनात्मक ध्यान:खोज और पुनर्प्राप्ति को अलग करना📄📷
- स्पैन: अत्यधिक कुशल अरब पैमाने पर लगभग निकटतम पड़ोसी खोज
- अर्थपूर्ण खोज से निपटना
- Azure Congnitive Search में सिमेंटिक सर्च
- हमने अपनी खोज को 10x स्मार्ट बनाने के लिए सिमेंटिक खोज का उपयोग कैसे किया
- दोहरे स्थान वाले शब्द एम्बेडिंग के साथ सिमेंटिक सर्च इंजन का निर्माण
- FAISS+SBERT के साथ अरब-पैमाने की सिमेंटिक समानता खोज
- समानता खोज थ्रेसहोल्ड के बारे में कुछ टिप्पणियां
- स्थानीयता संवेदनशील हैशिंग का उपयोग करके डुप्लिकेट छवि खोज के पास
- वेक्टर समानता खोज और फैस पर नि: शुल्क पाठ्यक्रम
- निकटतम पड़ोसियों के एल्गोरिदम के लिए व्यापक गाइड
- fastText
- Universal Sentence Encoder
- SBERT
- LaBSE
- LASER
- Haystack
- Jina.AI
- SentEval Toolkit
- BEIR :Benchmarking IR
- Which Frame?
- PySerini
- milvus
- weaviate
- natural-language-youtube-search
- same.energy
- scaNN
- annoy
- faiss
- DPR
- rank_BM25
- nearPy
- vearch
- PyNNDescent
- pgANN
- Tensorflow Similarity
- opensemanticsearch.org
- GPT3 Semantic Search
- searchy
- txtai
- HyperTag
- vectorai
- embeddinghub
- AquilaDb
- सिमेंटिक टेक्स्ट समानता डेटासेट हब
- फेसबुक एआई छवि समानता चुनौती
- WIT: विकिपीडिया-आधारित छवि पाठ डेटासेट
- कार्य सूची के लिए परियोजना बोर्ड पर एक नज़र डालें ताकि किसी भी खुले मुद्दे में योगदान किया जा सके।