तकनीक . Souk Weekly
एक अरबी-फ़र्स्ट लैंग्वेज मॉडल ने चुपचाप बदतर होना बंद कर दिया
स्थानीय भाषा-मॉडल इकोसिस्टम में हाल के सुधारों के अंदर, और क्यों वैश्विक फ़्रंटियर से अंतर लगभग किसी के अनुमान से तेज़ी से बंद हुआ.
अद्यतन

बारह महीने पहले, सबसे अच्छे अरबी-फ़र्स्ट लैंग्वेज मॉडल और किसी ग्लोबल मॉडल पर बोल्ट-ऑन अरबी क्षमता के बीच का अंतर इतना बड़ा था कि वह वास्तविक प्रोडक्ट समस्या था.
आज अंतर मौजूद है पर मापने योग्य. सामान्य सवालों में प्रदर्शन क़रीब-क़रीब बराबर है. अरबी सांस्कृतिक पृष्ठभूमि वाले सवालों में, स्थानीय मॉडल बेहतर है. कोडिंग में ग्लोबल मॉडल अब भी आगे है, पर निर्णायक अंतर से नहीं.
राज़ सिर्फ़ कंप्यूट का नहीं, डेटा का है. स्थानीय टीम ने पूरा एक साल अरबी किताबों, लेखों और टिप्पणियों का कॉर्पस साफ़ करने में बिताया — वेब से जो मिले उसे लेने के बजाय. नतीजा: एक छोटा मॉडल जो अरबी इस तरह पढ़ता है जैसे उसी में पला हो.
अगला सवाल: क्या टीम जारी रख पाएगी? मॉडल तेज़ी से सुधर रहे हैं, और लागत ऊँची है. पर कम से कम अब शुरुआती रेखा है.
साप्ताहिक
हफ़्ते में एक ईमेल.
अच्छी चीज़ें, अजीब चीज़ें, सूक की चीज़ें.