+
+
+
+
+
+
+
+## अपडेट / समाचार
+- **[1 जून 2026]** XMem के पास अब इसकी मेमोरी लेयर का नेटिव Golang कार्यान्वयन है। उच्च थ्रूपुट, कम विलंबता, और उत्पादन-स्तरीय परिनियोजन के लिए बनाया गया है जहां मेमोरी को लाखों इंटरैक्शन में विश्वसनीयता से काम करना होता है।
+- **[25 मई 2026]** स्थानीय वर्कस्पेस समर्थन अब लाइव है। XMem को मात्र 3 कमांड में स्थानीय रूप से सेट अप करें और मिनटों में मेमोरी के साथ निर्माण करना शुरू करें। सेटअप निर्देशों के लिए [Local.md](https://github.com/XortexAI/XMem/blob/main/Local.md) देखें।
+ ```bash
+npx create-xmem@latest
+cd xmem
+npm run dev
+```
+
+
+## XMem क्या है?
+
+LLM के साथ हर बातचीत शून्य से शुरू होती है। टूल स्विच करें, प्रदाता स्विच करें, अगले सप्ताह वापस आएं और सारा संदर्भ गायब है।
+
+XMem भारत की #1 ओपन सोर्स एजेंटिक मेमोरी लेयर है, हम मेमोरी-ऐज़-ए-सर्विस पेश कर रहे हैं, यानी हर AI उपयोग के मामले, डोमेन के लिए मेमोरी लेयर, चाहे वह लंबे समय तक चलने वाले एजेंटों के लिए समय-आधारित मेमोरी हो, रोगी संदर्भ के लिए चिकित्सा मेमोरी हो, टीमों और परियोजनाओं के लिए एंटरप्राइज मेमोरी हो, या कोडिंग एजेंटों और वर्कफ़्लो के लिए डेवलपर मेमोरी हो।
+
+यह स्टेटफुल AI के लिए एक अनूठी किस्म की एजेंटिक मेमोरी लेयर है।
+पारंपरिक मेमोरी सिस्टम के विपरीत जो केवल चंक संग्रहीत और पुनः प्राप्त करते हैं, XMem मेमोरी को एक सक्रिय तर्क प्रक्रिया में बदल देता है। यह निर्णय लेता है कि क्या याद रखना है, क्या अपडेट करना है, क्या भूलना है, और प्रत्येक मेमोरी को सही विशेषज्ञ एजेंट और स्टोर में गतिशील रूप से रूट करता है।
+
+## डेमो
+
+किसी भी AI प्लेटफॉर्म पर "X" टाइप करें और अपनी मेमोरी को निर्बाध रूप से संग्रहीत और खोजने, मौजूदा चैट से संदर्भ आयात करने, या अनुक्रमित रिपो के साथ काम करने के लिए XMem द्वारा दी जाने वाली चार मोड के बीच चयन करें।
+
+https://github.com/user-attachments/assets/8e3349ab-63c9-4046-821d-ca8097948440
+
+## विशेषताएं
+
+### Chrome एक्सटेंशन
+
+XMem Chrome एक्सटेंशन ChatGPT, Claude, Gemini, DeepSeek, और Perplexity को स्थायी मेमोरी लाता है।
+
+**लाइव सर्च और इंजेक्ट** - जैसे ही आप प्रॉम्प्ट टाइप करते हैं, XMem रीयल-टाइम में आपकी मेमोरी को खोजता है और एक फ्लोटिंग चिप दिखाता है। एक क्लिक सीधे आपके इनपुट में प्रासंगिक संदर्भ इंजेक्ट करता है, कोई घर्षण नहीं।
+
+**पृष्ठभूमि ऑटो-सेव (Xingest)** - जब आप "भेजें" दबाते हैं, XMem अनिवार्य रूप से बातचीत मोड़ को कैप्चर करता है। एक पृष्ठभूमि कतार आपके UI को छुए बिना तथ्यों और सारांशों को निकालता है।
+
+https://github.com/user-attachments/assets/97793cf9-d247-4d02-9c31-3cc9bbbf89aa
+
+### एजेंट प्लगइन
+
+इसमें [Claude Code](plugin/xmem-claude/), [Codex](plugin/xmem-codex/), [Cursor](plugin/xmem-cursor/), [Hermes](plugin/xmem-hermes/), [OpenClaw](plugin/xmem-openclaw/) और [OpenCode](plugin/xmem-opencode/) के लिए प्रथम-पक्षीय एकीकरण शामिल हैं, ताकि एजेंट मौजूदा मेमोरी खोज सकें, टिकाऊ परियोजना ज्ञान सहेज सकें, और सत्रों के बीच संदर्भ ले जा सकें जबकि API कुंजियों को पर्यावरण चर या क्लाइंट-विशिष्ट गुप्त स्टोर में रखते हैं।
+
+### संदर्भ
+
+संदर्भ आपको किसी भी चीज़ को मैन्युअल रूप से कॉपी पेस्ट किए बिना एक मौजूदा बातचीत को XMem में लाने देता है।
+
+साझा किया गया ChatGPT, Claude, या Gemini लिंक पेस्ट करें। XMem इसे खोलता है, हर उपयोगकर्ता और सहायक संदेश निकालता है, और पूरी इनगेशन पाइपलाइन चलाता है ताकि बातचीत खोज योग्य मेमोरी बन जाए।
+
+आप एक ट्रांसक्रिप्ट फ़ाइल (पाठ, मार्कडाउन, या JSON) भी अपलोड कर सकते हैं। XMem के पास Cursor और Antigravity निर्यात के लिए निर्मित पार्सिंग है और अज्ञात प्रारूपों के लिए एक LLM फॉलबैक का उपयोग करता है।
+
+https://github.com/user-attachments/assets/4ff22405-b7ad-4b78-9189-9a6e3ebd5e40
+
+### स्कैनर
+
+स्कैनर संपूर्ण Git रिपोजिटरीज को अनुक्रमित करता है और आपके कोडबेस का एक क्वेरीयोग्य ज्ञान ग्राफ बनाता है।
+
+एक बार अनुक्रमित होने के बाद, आप फ़ाइलों, कार्यों, निर्भरताओं, और प्रभाव के बारे में प्राकृतिक भाषा प्रश्न पूछ सकते हैं। इसका उपयोग एक नई रिपो को समझने, यह पता लगाने के लिए करें कि कोई सुविधा कहां रहती है, ट्रेस करें कि कोड कैसे जुड़ता है, या यह समझें कि आप कुछ बदलने से क्या टूट जाएगा।
+
+https://github.com/user-attachments/assets/f0fd393e-3820-404b-8d0e-e452e1dd52d0
+
+### बहु-डोमेन वर्गीकरण
+
+सभी मेमोरी समान नहीं है, और इसके साथ इसे उसी तरह व्यवहार करना अन्य समाधानों को कम प्रदर्शन करता है। XMem का **Classifier Agent** आने वाले प्रत्येक डेटा को विश्लेषण करता है और इसे सही डोमेन में रूट करता है:
+
+
+
+
डोमेन
+
यह क्या संग्रहीत करता है
+
उदाहरण
+
भंडारण
+
+
+
प्रोफाइल
+
स्थायी उपयोगकर्ता तथ्य, प्राथमिकताएं, पहचान
+
"मुझे backends के लिए Go, Python से ज्यादा पसंद है"
+
Pinecone
+
+
+
अस्थायी
+
समय-लंगर घटनाएं तारीख संकल्प के साथ
+
"मुझे कल Staff Engineer के रूप में पदोन्नति मिली"
+
Neo4j
+
+
+
सारांश
+
संपीड़ित बातचीत सारांश
+
"REST से gRPC में माइग्रेशन पर चर्चा की गई"
+
Pinecone
+
+
+
कोड
+
प्रतीकों से जुड़ी व्याख्याएं, बग, व्याख्याएं
+
"इस रीट्राई लॉजिक में एक रेस कंडीशन है"
+
Neo4j + Pinecone
+
+
+
स्निपेट
+
व्यक्तिगत कोड पैटर्न और उपयोगिता
+
"यह Go में मेरा मानक त्रुटि हैंडलर है"
+
Pinecone
+
+
+
छवि
+
दृश्य अवलोकन और विवरण
+
आर्किटेक्चर आरेख का स्क्रीनशॉट
+
Pinecone
+
+
+
+### एजेंटिक रिट्रीवल
+
+जब आप XMem को क्वेरी करते हैं, तो रिट्रीवल एक सरल वेक्टर सर्च नहीं है। LLM स्वयं निर्णय लेता है कि क्या *खोजना है*:
+
+1. **टूल चयन** - रिट्रीवल LLM आपकी क्वेरी का विश्लेषण करता है और उपयुक्त सर्च टूल (SearchProfile, SearchTemporal, SearchSummary, SearchSnippet) को कॉल करता है, संभावित रूप से समानांतर में कई।
+2. **संश्लेषण** - सभी सर्च टूल के परिणाम एकत्र किए जाते हैं और LLM स्रोत संदर्भों के साथ एक उद्धृत उत्तर उत्पन्न करता है।
+
+इसका अर्थ है *"मेरी पसंदीदा टेक स्टैक क्या है और मैंने अंतिम बार auth मॉड्यूल को रीफैक्टर कब किया?"* पूछना स्वचालित रूप से प्रोफाइल लुकअप और एक अस्थायी सर्च दोनों को ट्रिगर करता है।
+
+### Multi-LLM ऑर्केस्ट्रेशन फॉलबैक के साथ
+
+XMem एक प्रदाता पर बंद नहीं है। यह **Gemini, Claude, OpenAI, OpenRouter, Amazon Bedrock, और Ollama** में ऑर्केस्ट्रेट करता है स्वचालित फॉलबैक के साथ:
+
+```
+gemini -> claude -> openai -> bedrock -> ollama
+```
+
+यदि आपका प्राथमिक LLM दर सीमित करता है या नीचे चला जाता है, XMem चुपचाप अगले प्रदाता को फॉलबैक करता है। प्रत्येक एजेंट एक विशिष्ट मॉडल पर पिन किया जा सकता है। फॉलबैक क्रम पूरी तरह से कॉन्फ़िगर करने योग्य है।
+
+### स्थानीय रूप से चलाता है
+
+कोई क्लाउड निर्भरता आवश्यक नहीं है। Ollama के साथ XMem चलाएं LLM के लिए, FastEmbed एम्बेडिंग के लिए, और Chroma या SQLite वेक्टर स्टोरेज के लिए:
+
+```bash
+pip install -e ".[local]"
+```
+
+## आर्किटेक्चर
+
+
+
+XMem को **विशेषज्ञ AI एजेंटों की पाइपलाइन** के रूप में बनाया गया है जो LangGraph द्वारा समन्वित है, निर्धारणीय निष्पादन लेयर (Weaver) और तीन उद्देश्य-निर्मित संग्रहण इंजन द्वारा समर्थित है।
+
+### इनगेशन फ्लो
+
+```
+यूजर इनपुट (SDK / Chrome Extension / API)
+ |
+ v
+ +--------------+
+ | Classifier | पाठ का विश्लेषण करता है, डोमेन में रूट करता है
+ +------+-------+
+ |
+ +-----+-----+------+----------+
+ v v v v v
+ Profile Temporal Summary Code Snippet डोमेन एजेंट निकालते हैं
+ Agent Agent Agent Agent Agent संरचित डेटा समानांतर में
+ | | | | |
+ v v v v v
+ +----------------------------------+
+ | Judge Agent | मौजूदा मेमोरी के विरुद्ध तुलना करता है
+ | (ADD / UPDATE / DELETE / NOOP) | डुप्लिकेट और स्टेलनेस को रोकता है
+ +----------------+-----------------+
+ |
+ v
+ +----------------------------------+
+ | Weaver (Rust core) | निर्धारणीय निष्पादन
+ | Pinecone | Neo4j | MongoDB | कोई LLM नहीं। शुद्ध सॉफ्टवेयर तर्क।
+ +----------------------------------+
+```
+
+1. **Classifier** इनपुट को प्रासंगिक डोमेन में रूट करता है।
+2. **डोमेन एजेंट** (Profiler, Temporal, Summarizer, Code, Snippet, Image) समानांतर में संरचित डेटा निकालते हैं।
+3. **Judge Agent** प्रत्येक निष्कर्षण की तुलना मौजूदा मेमोरी से करता है और निर्णय लेता है: ADD, UPDATE, DELETE, या NOOP।
+4. **Weaver** Judge के निर्णयों को सभी भंडारण बैकएंड में निर्धारक रूप से निष्पादित करता है। कोर को एक स्टैंडअलोन Rust क्रेट के रूप में लागू किया जाता है कोई LLM निर्भरता के साथ।
+
+**उच्च-प्रयास मोड** स्वचालित रूप से लंबे इनपुट को ओवरलैपिंग चंक (~200 टोकन) में विभाजित करता है और उन्हें समानांतर में संसाधित करता है, फिर लंबी बातचीत में कुछ भी मिस न हो इसके लिए परिणामों को मर्ज करता है।
+
+### रिट्रीवल फ्लो
+
+```
+यूजर क्वेरी
+ |
+ v
++----------------------------------+
+| Retrieval LLM |
+| यह निर्धारित करता है कि कौन से |
+| टूल को कॉल करना है: |
+| SearchProfile, SearchTemporal, |
+| SearchSummary, SearchSnippet |
++----------------+-----------------+
+ |
+ +------------+------------+
+ v v v
+ Pinecone Neo4j Pinecone समानांतर सर्च निष्पादन
+ (profiles) (events) (summaries)
+ | | |
+ +------------+------------+
+ v
++----------------------------------+
+| उत्तर संश्लेषण + साइटेशन | LLM स्रोतों के साथ उत्तर उत्पन्न करता है
++----------------------------------+
+```
+
+### भंडारण
+
+
+
+
इंजन
+
उद्देश्य
+
के लिए प्रयुक्त
+
+
+
Pinecone
+
उच्च गति वेक्टर समानता सर्च
+
प्रोफाइल, सारांश, स्निपेट, कोड एनोटेशन
+
+
+
Neo4j
ग्राफ ट्रैवर्सल + समय-आधारित तर्क
घटनाएं, कोड ज्ञान ग्राफ, एनोटेशन
+
ग्राफ ट्रैवर्सल + अस्थायी तर्क
+
घटनाएं, कोड ज्ञान ग्राफ, एनोटेशन
+
+
+
MongoDB
+
कच्चा दस्तावेज़ भंडारण
+
स्कैन किया गया कोड, फ़ाइल मेटाडेटा, स्कैन स्थिति
+
+
+
+> [!NOTE]
+> स्थानीय परिनियोजन के लिए, Pinecone को **Chroma**, **pgvector**, या **SQLite** वेक्टर स्टोर के साथ प्रतिस्थापित किया जा सकता है।
+
+## बेंचमार्क
+
+हमने XMem को दो प्रतिष्ठित शैक्षणिक बेंचमार्क पर हर प्रमुख मेमोरी समाधान के खिलाफ परीक्षा की। XMem पूरे बोर्ड में बेहतर प्रदर्शन करता है।
+
+### LoCoMo
+
+मेमोरी पर रचनात्मक तर्क का परीक्षण करता है। क्या सिस्टम विभिन्न बातचीत में तथ्यों को जोड़ सकता है, अस्थायी संबंधों के बारे में तर्क कर सकता है, और खुले सिरे के प्रश्नों का उत्तर दे सकता है?
+
+
+
+
विधि
+
एकल-हॉप (%)
+
मल्टी-हॉप (%)
+
खुली डोमेन (%)
+
अस्थायी (%)
+
समग्र (%)
+
+
XMEM (हमारा)
90.6
92.3
91.2
91.9
91.5
+
Zep
74.11
66.04
67.71
79.79
75.14
+
Memobase (v0.0.37)
70.92
46.88
77.17
85.05
75.78
+
Mem0g (YC 24)
65.71
47.19
75.71
58.13
68.44
+
Mem0 (YC 24)
67.13
51.15
72.93
55.51
66.88
+
LangMem
62.23
47.92
71.12
23.43
58.10
+
OpenAI
63.79
42.92
62.29
21.71
52.90
+
+
+> बहु-हॉप तर्क पर (विभिन्न बातचीत से तथ्यों को जोड़ना), XMem अगले सर्वश्रेष्ठ सिस्टम को **26.3 अंक** से हराता है। कुल मिलाकर, XMem **91.5%** पर सभी सिस्टमों का नेतृत्व करता है, जो Zep से 75.14 पर आगे है।
+
+### LongMemEval-S
+
+दीर्घकालीन संवादी मेमोरी के लिए उद्योग मानक बेंचमार्क। यह परीक्षण करता है कि क्या कोई सिस्टम तथ्य याद रख सकता है, प्राथमिकता परिवर्तन को ट्रैक कर सकता है, समय के बारे में तर्क कर सकता है, और सत्रों के बीच संदर्भ बनाए रख सकता है।
+
+
+
+
श्रेणी
+
XMem (Gemini 3-flash)
+
Backboard.io (GPT-4o)
+
Mastra (GPT-4o)
+
Supermemory (GPT-4o)
+
+
मल्टी-सेशन
93.6
91.7
79.7
71.43
+
अस्थायी तर्क
94.5
91.7
85.7
76.69
+
एकल-सेशन सहायक
96.43
98.2
82.1
96.43
+
एकल-सेशन उपयोगकर्ता
97.1
97.1
98.6
97.14
+
ज्ञान अपडेट
91.2
93.6
85.9
88.46
+
एकल-सेशन प्राथमिकता
87.0
90.0
73.3
70.0
+
+
+> XMem Backboard.io के साथ सभी श्रेणियों में मेल खाता है, दोनों सत्र रिकॉल और प्राथमिकता ट्रैकिंग पर near-perfect स्कोर करते हैं। XMem Mastra को **9.2 अंक** से और Supermemory को **11.8 अंक** से बेहतर प्रदर्शन करता है।
+
+### हम कैसे बेंचमार्क करते हैं
+- **मूल्यांकन**: LLM-as-Judge Gemini का उपयोग करके संरचित रूब्रिक के साथ
+- **निष्पक्षता**: सभी सिस्टम समान बातचीत इतिहास और क्वेरी के साथ परीक्षा की जाती है
+
+## त्वरित शुरुआत
+
+### स्थानीय XMem
+
+```bash
+npx create-xmem@latest
+cd xmem
+npm run dev
+```
+
+यह Windows, macOS, और Linux पर काम करता है। यह एक स्थानीय XMem वर्कस्पेस बनाता है, बैकएंड स्थापित करता है, स्थानीय भंडारण शुरू करता है, Chrome एक्सटेंशन बनाता है, और API को `http://localhost:8000` पर लॉन्च करता है।
+
+स्थानीय पूर्वापेक्षाएं:
+
+- Git
+- Node.js 20+
+- Python 3.11+
+- Docker Desktop
+- Ollama, जब तक कि आप `.env` में क्लाउड LLM कुंजी न जोड़ें
+
+सेटअप के बाद, निम्न से एक्सटेंशन लोड करें:
+
+```text
+repos/xmem-extension/dist
+```
+
+Chrome पथ: `chrome://extensions` -> डेवलपर मोड सक्षम करें -> अनपैक किए गए को लोड करें।
+
+### स्थानीय कमांड
+
+```bash
+npm run setup
+npm run start
+npm run verify
+npm run doctor
+```
+
+यदि `.env` एक वास्तविक क्लाउड LLM कुंजी रखता है, XMem उस प्रदाता का उपयोग करता है और FastEmbed के साथ एम्बेडिंग को स्थानीय रखता है। यदि कोई क्लाउड कुंजी कॉन्फ़िगर नहीं है, XMem स्थानीय Ollama में फॉलबैक करता है और सेटअप के दौरान आवश्यक स्थानीय मॉडल खींचता है।
+
+### संदर्भ पोर्टेबिलिटी
+
+```bash
+npm run context:export
+npm run context:import -- --file ./exports/xmem-context.json
+npm run context:sync -- --file ./exports/xmem-context.json --server https://api.xmem.in --api-key
+```
+
+`context:export` एक स्थानीय संदर्भ बंडल लिखता है जिसे बाद में आयात किया जा सकता है या एक XMem सर्वर में सिंक किया जा सकता है।
+
+### रिपोजिटरी को अनुक्रमित करें
+
+```bash
+python -m src.scanner.runner \
+ --org your-org \
+ --repo your-repo \
+ --url https://github.com/your-org/your-repo.git \
+ --enrich
+```
+
+> [!TIP]
+> पूरी तरह से स्थानीय सेटअप के लिए कोई क्लाउड निर्भरता के साथ:
+> ```ini
+> FALLBACK_ORDER='["ollama"]'
+> EMBEDDING_PROVIDER=ollama
+> VECTOR_STORE_PROVIDER=pgvector
+> ```
+> फिर स्थानीय अतिरिक्त स्थापित करें: `pip install -e ".[local]"`
+
+## कॉन्फ़िगरेशन
+
+XMem अत्यधिक कॉन्फ़िगरेबल है। किसी भी एजेंट के मॉडल को ओवरराइड करें, फॉलबैक चेन को ट्यून करें, या गुणवत्ता/गति ट्रेडऑफ को समायोजित करें।
+
+
+
+
सेटिंग
+
डिफ़ॉल्ट
+
विवरण
+
+
FALLBACK_ORDER
openrouter,gemini,claude,openai
प्रदाता फॉलबैक अनुक्रम
+
DEEPSEEK_API_KEY
खाली
आधिकारिक OpenAI-संगत एंडपॉइंट के लिए DeepSeek API कुंजी
+
MIMO_API_KEY
खाली
आधिकारिक OpenAI-संगत एंडपॉइंट के लिए Xiaomi MiMo API कुंजी