تكنولوجيا . Souk Weekly
نموذج لغةٍ عربيّ المنشأ توقّف بهدوء عن أن يكون الأسوأ
داخل التحسينات الأخيرة في منظومة النماذج اللغويّة المحلّيّة، ولماذا أُغلقت الفجوة مع الحدود العالميّة أسرع ممّا توقّع أحد.
حُدِّث

قبل اثني عشر شهرًا، كانت الفجوة بين أفضل نموذجٍ عربيّ المنشأ وأفضل قدرةٍ عربيّةٍ مُضافة على نموذجٍ عالميّ واسعةً بما يكفي لتكون مشكلةً منتجيّةً حقيقيّة.
اليوم، الفجوة موجودة لكنّها قابلة للقياس. في الأسئلة العامّة، الأداء متقارب. في الأسئلة ذات الخلفيّة الثقافيّة العربيّة، النموذج المحلّيّ متفوّق. في البرمجة، النموذج العالميّ ما زال أفضل، لكن ليس بفارقٍ حاسم.
السرّ ليس في الحوسبة وحدها، بل في البيانات. الفريق المحلّيّ أمضى سنةً كاملةً في تنظيف كوربس من الكتب والمقالات والتعليقات العربيّة، بدلًا من اعتراض ما يتوفّر من الويب. النتيجة: نموذجٌ أصغر يقرأ العربيّة كأنّه نشأ بها.
السؤال التالي: هل يستطيع الفريق الاستمرار؟ النماذج تتحسّن بسرعة، والكلفة عالية. لكن على الأقلّ، صار هناك خطّ بداية.
النشرة الأسبوعية
بريدٌ واحد في الأسبوع.
ما يستحقّ، وما يُدهش، وما هو من نسيج السوق.