BMS، BUS، صنعتی، آلات کیبل کے لیے۔

جیسے جیسے بہار کا تہوار اختتام کو پہنچ رہا ہے، ڈیپ سیک کے ارد گرد جوش و خروش برقرار ہے۔ حالیہ چھٹی نے ٹیک انڈسٹری کے اندر مقابلے کے ایک اہم احساس کو اجاگر کیا، جس میں بہت سے لوگ اس "کیٹ فش" پر بحث اور تجزیہ کر رہے ہیں۔ سلیکن ویلی بحران کے ایک بے مثال احساس کا سامنا کر رہی ہے: اوپن سورس کے حامی ایک بار پھر اپنی رائے کا اظہار کر رہے ہیں، اور یہاں تک کہ OpenAI اس بات کا دوبارہ جائزہ لے رہا ہے کہ آیا اس کی بند سورس کی حکمت عملی بہترین انتخاب تھی۔ کم کمپیوٹیشنل لاگت کے نئے نمونے نے Nvidia جیسی چپ کمپنیز کے درمیان ایک سلسلہ رد عمل کو جنم دیا ہے، جس کے نتیجے میں امریکی اسٹاک مارکیٹ کی تاریخ میں ایک دن کی مارکیٹ ویلیو میں کمی ریکارڈ کی گئی ہے، جب کہ حکومتی ایجنسیاں DeepSeek کی جانب سے استعمال کردہ چپس کی تعمیل کی تحقیقات کر رہی ہیں۔ بیرون ملک ڈیپ سیک کے ملے جلے جائزوں کے درمیان، مقامی طور پر، اسے غیر معمولی ترقی کا سامنا ہے۔ R1 ماڈل کے آغاز کے بعد، متعلقہ ایپ نے ٹریفک میں اضافہ دیکھا ہے، جس سے ظاہر ہوتا ہے کہ ایپلیکیشن کے شعبوں میں ترقی مجموعی AI ماحولیاتی نظام کو آگے بڑھائے گی۔ مثبت پہلو یہ ہے کہ DeepSeek ایپلیکیشن کے امکانات کو وسیع کرے گا، یہ تجویز کرتا ہے کہ ChatGPT پر انحصار کرنا مستقبل میں اتنا مہنگا نہیں ہوگا۔ اس تبدیلی کی عکاسی OpenAI کی حالیہ سرگرمیوں میں ہوئی ہے، بشمول DeepSeek R1 کے جواب میں مفت صارفین کے لیے o3-mini نامی ایک استدلال ماڈل کی فراہمی، اور ساتھ ہی بعد میں ہونے والے اپ گریڈز جنہوں نے o3-mini کی سوچ کو عوامی بنا دیا۔ بہت سے غیر ملکی صارفین نے ان پیش رفت کے لیے DeepSeek کا شکریہ ادا کیا، حالانکہ یہ سوچ کا سلسلہ خلاصہ کے طور پر کام کرتا ہے۔
امید کے ساتھ، یہ واضح ہے کہ ڈیپ سیک گھریلو کھلاڑیوں کو متحد کر رہا ہے۔ ٹریننگ کے اخراجات کو کم کرنے پر اپنی توجہ کے ساتھ، مختلف اپ اسٹریم چپ مینوفیکچررز، انٹرمیڈیٹ کلاؤڈ فراہم کرنے والے، اور متعدد اسٹارٹ اپ فعال طور پر ماحولیاتی نظام میں شامل ہو رہے ہیں، جس سے ڈیپ سیک ماڈل کو استعمال کرنے کے لیے لاگت کی کارکردگی میں اضافہ ہو رہا ہے۔ ڈیپ سیک کے کاغذات کے مطابق، V3 ماڈل کی مکمل تربیت کے لیے صرف 2.788 ملین H800 GPU گھنٹے درکار ہیں، اور تربیت کا عمل انتہائی مستحکم ہے۔ 405 بلین پیرامیٹرز کے ساتھ Llama 3 کے مقابلے میں MOE (ماہرین کا مرکب) فن تعمیر پری ٹریننگ کے اخراجات کو دس کے عنصر سے کم کرنے کے لیے اہم ہے۔ فی الحال، V3 پہلا عوامی طور پر تسلیم شدہ ماڈل ہے جو MoE میں اس طرح کے اعلیٰ تفاوت کا مظاہرہ کرتا ہے۔ مزید برآں، ایم ایل اے (ملٹی لیئر اٹینشن) ہم آہنگی سے کام کرتا ہے، خاص طور پر استدلال کے پہلوؤں میں۔ "ایم او ای جتنا کم ہوگا، کمپیوٹیشنل پاور کو مکمل طور پر استعمال کرنے کے لیے استدلال کے دوران بیچ کا سائز اتنا ہی بڑا ہوگا، جس میں KVCache کا سائز کلیدی محدود کرنے والا عنصر ہے؛ ایم ایل اے KVCache کے سائز کو نمایاں طور پر کم کرتا ہے،" Chuanjing Technology کے ایک محقق نے AI ٹیکنالوجی ریویو کے تجزیہ میں نوٹ کیا۔ مجموعی طور پر، ڈیپ سیک کی کامیابی مختلف ٹیکنالوجیز کے امتزاج میں مضمر ہے، نہ کہ صرف ایک۔ انڈسٹری کے اندرونی افراد ڈیپ سیک ٹیم کی انجینئرنگ صلاحیتوں کی تعریف کرتے ہیں، متوازی تربیت اور آپریٹر کی اصلاح میں ان کی عمدگی کو نوٹ کرتے ہوئے، ہر تفصیل کو بہتر بنا کر شاندار نتائج حاصل کرتے ہیں۔ DeepSeek کا اوپن سورس اپروچ بڑے ماڈلز کی مجموعی ترقی کو مزید تقویت دیتا ہے، اور یہ توقع کی جاتی ہے کہ اگر اسی طرح کے ماڈلز تصاویر، ویڈیوز اور مزید میں پھیلتے ہیں، تو یہ پوری صنعت میں مانگ کو نمایاں طور پر متحرک کرے گا۔
تھرڈ پارٹی ریزننگ سروسز کے مواقع
ڈیٹا بتاتا ہے کہ اپنی ریلیز کے بعد سے، DeepSeek نے صرف 21 دنوں کے اندر 22.15 ملین یومیہ فعال صارفین (DAU) اکٹھے کیے ہیں، جس سے ChatGPT کے 41.6% یوزر بیس کو حاصل کیا گیا ہے اور Doubao کے 16.95 ملین یومیہ فعال صارفین کو پیچھے چھوڑ دیا گیا ہے، اس طرح ایپل سٹور کے ممالک میں سب سے زیادہ تیزی سے ترقی کرنے والی ایپلی کیشن بن گئی ہے۔ تاہم، جب صارفین کی بڑی تعداد میں جمع ہو گئے، سائبر ہیکرز ڈیپ سیک ایپ پر مسلسل حملہ کر رہے ہیں، جس سے اس کے سرورز پر خاصا دباؤ پڑا ہے۔ صنعت کے تجزیہ کاروں کا خیال ہے کہ یہ جزوی طور پر ڈیپ سیک کی جانب سے تربیت کے لیے کارڈز کی تعیناتی کی وجہ سے ہے جبکہ استدلال کے لیے کافی کمپیوٹیشنل طاقت کی کمی ہے۔ انڈسٹری کے ایک اندرونی نے AI ٹیکنالوجی ریویو کو آگاہ کیا، "سرور کے اکثر مسائل کو فیس چارج کرکے یا مزید مشینیں خریدنے کے لیے فنانسنگ کے ذریعے آسانی سے حل کیا جا سکتا ہے؛ بالآخر، یہ ڈیپ سیک کے فیصلوں پر منحصر ہے۔" یہ ٹکنالوجی بمقابلہ پروڈکٹائزیشن پر توجہ مرکوز کرنے میں ایک تجارتی بند پیش کرتا ہے۔ ڈیپ سیک نے خود کفالت کے لیے بڑی حد تک کوانٹم کوانٹائزیشن پر انحصار کیا ہے، اس نے بہت کم بیرونی فنڈنگ حاصل کی ہے، جس کے نتیجے میں کیش فلو کا دباؤ نسبتاً کم ہے اور ایک خالص تکنیکی ماحول ہے۔ فی الحال، مذکورہ بالا مسائل کی روشنی میں، کچھ صارفین ڈیپ سیک پر سوشل میڈیا پر زور دے رہے ہیں کہ وہ استعمال کی حد کو بلند کرے یا صارف کے آرام کو بڑھانے کے لیے بامعاوضہ خصوصیات متعارف کرائیں۔ مزید برآں، ڈویلپرز نے آپٹیمائزیشن کے لیے آفیشل API یا تھرڈ پارٹی APIs کا استعمال شروع کر دیا ہے۔ تاہم، ڈیپ سیک کے اوپن پلیٹ فارم نے حال ہی میں اعلان کیا، "موجودہ سرور کے وسائل کم ہیں، اور API سروس ریچارجز کو معطل کر دیا گیا ہے۔"
بلاشبہ یہ AI بنیادی ڈھانچے کے شعبے میں تیسرے فریق کے دکانداروں کے لیے مزید مواقع کھولتا ہے۔ حال ہی میں، متعدد ملکی اور بین الاقوامی کلاؤڈ جنات نے DeepSeek کے ماڈل APIs کا آغاز کیا ہے- بیرون ملک مقیم کمپنیاں Microsoft اور Amazon جنوری کے آخر میں شامل ہونے والے پہلے لوگوں میں شامل تھے۔ گھریلو رہنما، ہواوے کلاؤڈ نے پہلا قدم اٹھایا، جس نے 1 فروری کو سلیکون پر مبنی فلو کے ساتھ مل کر DeepSeek R1 اور V3 استدلال کی خدمات جاری کیں۔ AI ٹیکنالوجی ریویو کی رپورٹس بتاتی ہیں کہ Silicon-based Flow کی سروسز نے پلیٹ فارم کو مؤثر طریقے سے "کریش" کرتے ہوئے صارفین کی آمد دیکھی ہے۔ تین بڑی ٹیک کمپنیوں — BAT (Baidu, Alibaba, Tencent) اور ByteDance — نے بھی 3 فروری سے شروع ہونے والی کم لاگت، محدود مدت کی پیشکشیں جاری کیں، جو گزشتہ سال کے کلاؤڈ وینڈر پرائس وار کی یاد دلاتی ہیں جو DeepSeek کے V2 ماڈل کے آغاز سے شروع ہوئی تھی، جہاں DeepSeek کو "قیمت قصائی" کہا جانے لگا۔ کلاؤڈ وینڈرز کے بزدلانہ اقدامات مائیکروسافٹ Azure اور OpenAI کے درمیان پہلے کے مضبوط تعلقات کی بازگشت کرتے ہیں، جہاں 2019 میں، Microsoft نے OpenAI میں $1 بلین کی کافی سرمایہ کاری کی اور 2023 میں ChatGPT کے آغاز کے بعد فائدہ اٹھایا۔ تاہم، یہ قریبی تعلق Meta open-sourced Llama کے بعد کھلنا شروع ہوا، جس سے دوسرے بڑے دکانداروں کو مائیکروسافٹ کے باہر اپنے بڑے وینڈرز کو مائیکروسافٹ کے ساتھ کام کرنے کی اجازت ملی۔ اس مثال میں، DeepSeek نے نہ صرف پروڈکٹ ہیٹ کے لحاظ سے ChatGPT کو پیچھے چھوڑ دیا ہے بلکہ O1 ریلیز کے بعد اوپن سورس ماڈلز بھی متعارف کرائے ہیں، جیسا کہ Llama کے GPT-3 کے احیاء سے متعلق جوش و خروش سے ملتا جلتا ہے۔
حقیقت میں، کلاؤڈ فراہم کرنے والے خود کو AI ایپلی کیشنز کے لیے ٹریفک گیٹ وے کے طور پر بھی پوزیشن میں لے رہے ہیں، یعنی ڈویلپرز کے ساتھ گہرے تعلقات کا ترجمہ پیشگی فوائد میں ہوتا ہے۔ رپورٹس بتاتی ہیں کہ Baidu Smart Cloud کے 15,000 سے زیادہ صارفین تھے جنہوں نے ڈیپ سیک ماڈل کو Qianfan پلیٹ فارم کے ذریعے لانچ کے دن استعمال کیا۔ مزید برآں، کئی چھوٹی فرمیں حل پیش کر رہی ہیں، بشمول سلکان پر مبنی فلو، لوچین ٹیکنالوجی، چوانجنگ ٹیکنالوجی، اور مختلف AI انفرا پرووائیڈرز جنہوں نے ڈیپ سیک ماڈلز کے لیے سپورٹ شروع کیا ہے۔ AI ٹیکنالوجی ریویو نے یہ سیکھا ہے کہ ڈیپ سیک کی مقامی تعیناتیوں کے لیے موجودہ اصلاح کے مواقع بنیادی طور پر دو شعبوں میں موجود ہیں: ایک ایم او ای ماڈل کی اسپارسٹی خصوصیات کے لیے 671 بلین پیرامیٹر MoE ماڈل کو مقامی طور پر تعینات کرنے کے لیے مخلوط استدلال کا طریقہ استعمال کرتے ہوئے ہائبرڈ GPU/CPU انفرنس کا استعمال کر رہا ہے۔ مزید برآں، ایم ایل اے کی اصلاح ضروری ہے۔ تاہم، ڈیپ سیک کے دو ماڈلز کو اب بھی تعیناتی کی اصلاح میں کچھ چیلنجز کا سامنا ہے۔ "ماڈل کے سائز اور متعدد پیرامیٹرز کی وجہ سے، اصلاح درحقیقت پیچیدہ ہے، خاص طور پر مقامی تعیناتیوں کے لیے جہاں کارکردگی اور لاگت کے درمیان بہترین توازن حاصل کرنا مشکل ہو گا،" چوانجنگ ٹیکنالوجی کے ایک محقق نے کہا۔ سب سے اہم رکاوٹ میموری کی صلاحیت کی حدود پر قابو پانے میں ہے۔ "ہم CPUs اور دیگر کمپیوٹیشنل وسائل کو مکمل طور پر استعمال کرنے کے لیے ایک متضاد تعاون کا نقطہ نظر اپناتے ہیں، اعلی کارکردگی والے CPU آپریٹرز کا استعمال کرتے ہوئے پروسیسنگ کے لیے اسپارس MoE میٹرکس کے صرف غیر مشترکہ حصوں کو CPU/DRAM پر رکھتے ہیں، جبکہ گھنے حصے GPU پر رہتے ہیں۔" انہوں نے مزید وضاحت کی۔ رپورٹس بتاتی ہیں کہ چوانجنگ کا اوپن سورس فریم ورک KTransformers بنیادی طور پر مختلف حکمت عملیوں اور آپریٹرز کو ایک ٹیمپلیٹ کے ذریعے اصل ٹرانسفارمرز کے نفاذ میں داخل کرتا ہے، جس سے CUDAGraph جیسے طریقوں کا استعمال کرتے ہوئے تخمینہ کی رفتار میں نمایاں اضافہ ہوتا ہے۔ ڈیپ سیک نے ان اسٹارٹ اپس کے لیے مواقع پیدا کیے ہیں، کیونکہ ترقی کے فوائد واضح ہو رہے ہیں۔ بہت ساری فرموں نے ڈیپ سیک API کو شروع کرنے کے بعد صارفین میں نمایاں اضافہ کی اطلاع دی ہے، اور اصلاح کی تلاش میں پچھلے کلائنٹس سے پوچھ گچھ حاصل کی ہے۔ صنعت کے اندرونی ذرائع نے نوٹ کیا ہے، "ماضی میں، کسی حد تک قائم کلائنٹ گروپس کو اکثر بڑی کمپنیوں کی معیاری خدمات میں بند کر دیا جاتا تھا، جو کہ پیمانے کی وجہ سے ان کی لاگت کے فوائد سے سختی سے پابند ہوتے تھے۔ تاہم، بہار میلے سے پہلے DeepSeek-R1/V3 کی تعیناتی کو مکمل کرنے کے بعد، ہمیں اچانک تعاون کی درخواستیں موصول ہوئیں، اور ہمارے کئی معروف کلائنٹس سے رابطہ کرنے والے کلائنٹس سے بھی رابطہ کیا گیا۔ ڈیپ سیک خدمات۔" فی الحال، ایسا معلوم ہوتا ہے کہ ڈیپ سیک ماڈل انفرنس کی کارکردگی کو تیزی سے اہم بنا رہا ہے، اور بڑے ماڈلز کو وسیع تر اپنانے کے ساتھ، یہ AI انفرا انڈسٹری میں ترقی کو نمایاں طور پر متاثر کرتا رہے گا۔ اگر ڈیپ سیک سطح کے ماڈل کو مقامی طور پر کم قیمت پر تعینات کیا جا سکتا ہے، تو اس سے حکومت اور انٹرپرائز کی ڈیجیٹل تبدیلی کی کوششوں میں بہت مدد ملے گی۔ تاہم، چیلنجز برقرار ہیں، کیونکہ کچھ کلائنٹس بڑے ماڈل کی صلاحیتوں کے حوالے سے بہت زیادہ توقعات رکھتے ہیں، جس سے یہ زیادہ واضح ہوتا ہے کہ عملی تعیناتی میں کارکردگی اور لاگت کا توازن بہت ضروری ہے۔
یہ جانچنے کے لیے کہ آیا DeepSeek ChatGPT سے بہتر ہے، ان کے اہم فرقوں، طاقتوں اور استعمال کے معاملات کو سمجھنا ضروری ہے۔ یہاں ایک جامع موازنہ ہے:
خصوصیت/ پہلو | ڈیپ سیک | چیٹ جی پی ٹی |
---|---|---|
ملکیت | ایک چینی کمپنی نے تیار کیا ہے۔ | OpenAI کے ذریعہ تیار کردہ |
ماخذ ماڈل | اوپن سورس | ملکیتی |
لاگت | استعمال کرنے کے لئے مفت؛ سستے API رسائی کے اختیارات | سبسکرپشن یا ادائیگی فی استعمال قیمت |
حسب ضرورت | انتہائی حسب ضرورت، صارفین کو اس پر موافقت اور تعمیر کرنے کی اجازت دیتا ہے۔ | محدود حسب ضرورت دستیاب ہے۔ |
مخصوص کاموں میں کارکردگی | ڈیٹا اینالیٹکس اور معلومات کی بازیافت جیسے مخصوص شعبوں میں ایکسل | تخلیقی تحریر اور گفتگو کے کاموں میں مضبوط کارکردگی کے ساتھ ورسٹائل |
زبان کی حمایت | چینی زبان اور ثقافت پر بھرپور توجہ | وسیع زبان کی حمایت لیکن امریکی مرکوز |
تربیت کی لاگت | کم تربیتی اخراجات، کارکردگی کے لیے موزوں | اعلی تربیتی اخراجات، کافی کمپیوٹیشنل وسائل کی ضرورت ہوتی ہے۔ |
جوابی تغیر | ممکنہ طور پر جغرافیائی سیاسی تناظر سے متاثر ہو کر مختلف ردعمل پیش کر سکتے ہیں۔ | تربیت کے اعداد و شمار پر مبنی مستقل جوابات |
ہدفی سامعین | لچک کے خواہاں ڈویلپرز اور محققین کا مقصد | بات چیت کی صلاحیتوں کی تلاش میں عام صارفین کا مقصد |
کیسز استعمال کریں۔ | کوڈ جنریشن اور فوری کاموں کے لیے زیادہ موثر | متن پیدا کرنے، سوالات کا جواب دینے اور مکالمے میں مشغول ہونے کے لیے مثالی۔ |
"Nvidia میں خلل ڈالنے" پر ایک تنقیدی تناظر
اس وقت، Huawei کے علاوہ، Moore Threads، Muxi، Biran Technology، اور Tianxu Zhixin جیسے کئی گھریلو چپ بنانے والے بھی DeepSeek کے دو ماڈلز کو اپنا رہے ہیں۔ ایک چپ بنانے والے نے AI ٹیکنالوجی ریویو کو بتایا، "DeepSeek کا ڈھانچہ جدت کو ظاہر کرتا ہے، پھر بھی یہ ایک LLM ہے۔ ڈیپ سیک کے لیے ہماری موافقت بنیادی طور پر استدلال کی ایپلی کیشنز پر مرکوز ہے، جس سے تکنیکی عمل درآمد کافی سیدھا اور تیز ہوتا ہے۔" تاہم، MoE اپروچ کے لیے سٹوریج اور ڈسٹری بیوشن کے حوالے سے زیادہ مطالبات کی ضرورت ہوتی ہے، جس کے ساتھ گھریلو چپس کے ساتھ تعیناتی کے دوران مطابقت کو یقینی بنانا، متعدد انجینئرنگ چیلنجز پیش کرتے ہیں جنہیں موافقت کے دوران حل کرنے کی ضرورت ہوتی ہے۔ "فی الحال، گھریلو کمپیوٹیشنل طاقت استعمال اور استحکام میں Nvidia سے مماثل نہیں ہے، سافٹ ویئر ماحول کے سیٹ اپ، ٹربل شوٹنگ، اور بنیادی کارکردگی کی اصلاح کے لیے اصل فیکٹری کی شرکت کی ضرورت ہوتی ہے،" صنعت کے ایک ماہر نے عملی تجربے کی بنیاد پر کہا۔ اس کے ساتھ ہی، "DeepSeek R1 کے بڑے پیرامیٹر پیمانے کی وجہ سے، گھریلو کمپیوٹیشنل پاور کو متوازی کرنے کے لیے مزید نوڈس کی ضرورت ہوتی ہے۔ مزید برآں، گھریلو ہارڈ ویئر کی تفصیلات ابھی بھی کچھ پیچھے ہیں؛ مثال کے طور پر، Huawei 910B فی الحال DeepSeek کے متعارف کرائے گئے FP8 تخمینے کی حمایت نہیں کر سکتا۔" DeepSeek V3 ماڈل کی ایک خاص بات FP8 مخلوط صحت سے متعلق تربیتی فریم ورک کا تعارف ہے، جس کی توثیق ایک انتہائی بڑے ماڈل پر مؤثر طریقے سے کی گئی ہے، جو کہ ایک اہم کامیابی ہے۔ اس سے پہلے، مائیکروسافٹ اور نیوڈیا جیسے بڑے کھلاڑیوں نے متعلقہ کام کی تجویز دی تھی، لیکن فزیبلٹی کے حوالے سے صنعت کے اندر شکوک و شبہات باقی ہیں۔ یہ سمجھا جاتا ہے کہ INT8 کے مقابلے میں، FP8 کا بنیادی فائدہ یہ ہے کہ پوسٹ ٹریننگ کوانٹائزیشن تقریباً نقصان کے بغیر درستگی حاصل کر سکتی ہے جبکہ انفرنس کی رفتار کو نمایاں طور پر بڑھاتا ہے۔ FP16 سے موازنہ کرتے وقت، FP8 Nvidia کے H20 پر دو گنا ایکسلریشن اور H100 پر 1.5 گنا سے زیادہ ایکسلریشن کا احساس کر سکتا ہے۔ خاص طور پر، جیسا کہ گھریلو کمپیوٹیشنل پاور کے علاوہ گھریلو ماڈلز کے رجحان سے متعلق بحثیں زور پکڑ رہی ہیں، اس بارے میں قیاس آرائیاں کہ آیا Nvidia میں خلل پڑ سکتا ہے، اور آیا CUDA moat کو نظرانداز کیا جا سکتا ہے، تیزی سے پھیلتا جا رہا ہے۔ ایک ناقابل تردید حقیقت یہ ہے کہ ڈیپ سیک نے واقعی Nvidia کی مارکیٹ ویلیو میں کافی کمی کی ہے، لیکن یہ تبدیلی Nvidia کی اعلیٰ درجے کی کمپیوٹیشنل پاور انٹیگریٹی کے حوالے سے سوالات اٹھاتی ہے۔ سرمائے سے چلنے والے کمپیوٹیشنل جمع کے حوالے سے پہلے قبول شدہ بیانیے کو چیلنج کیا جا رہا ہے، پھر بھی Nvidia کے لیے تربیتی منظرناموں میں مکمل طور پر تبدیل ہونا مشکل ہے۔ ڈیپ سیک کے CUDA کے گہرے استعمال کے تجزیے سے پتہ چلتا ہے کہ لچک — جیسے کہ مواصلات کے لیے SM کا استعمال کرنا یا نیٹ ورک کارڈز کو براہ راست جوڑنا — باقاعدہ GPUs کو ایڈجسٹ کرنے کے لیے ممکن نہیں ہے۔ صنعت کے نقطہ نظر اس بات پر زور دیتے ہیں کہ Nvidia کی کھائی صرف CUDA کے بجائے پورے CUDA ماحولیاتی نظام کو گھیرے ہوئے ہے، اور PTX (متوازی تھریڈ ایگزیکیوشن) ہدایات جو DeepSeek استعمال کرتی ہیں وہ اب بھی CUDA ماحولیاتی نظام کا حصہ ہیں۔ "مختصر مدت میں، Nvidia کی کمپیوٹیشنل طاقت کو نظر انداز نہیں کیا جا سکتا ہے- یہ خاص طور پر تربیت میں واضح ہے؛ تاہم، استدلال کے لیے گھریلو کارڈز کی تعیناتی نسبتاً آسان ہو گی، اس لیے پیشرفت تیز تر ہو جائے گی۔ گھریلو کارڈز کی موافقت بنیادی طور پر تخمینہ پر مرکوز ہے؛ کوئی بھی ابھی تک ڈیپ سیک کے ماڈل کے ماڈل کو تربیت دینے میں کامیاب نہیں ہوسکا ہے۔ مجموعی طور پر، ایک نقطہ نظر سے، حالات گھریلو بڑے ماڈل چپس کے لیے حوصلہ افزا ہیں۔ تربیت کی ضرورت سے زیادہ ضرورتوں کی وجہ سے، جو داخلے میں رکاوٹ بنتی ہے، اندازہ کے دائرے میں گھریلو چپ بنانے والوں کے لیے مواقع زیادہ واضح ہیں۔ تجزیہ کاروں کا کہنا ہے کہ گھریلو انفرنس کارڈز کا استعمال ہی کافی ہے۔ اگر ضروری ہو تو، ایک اضافی مشین کا حصول ممکن ہے، جبکہ تربیتی ماڈل منفرد چیلنجز پیش کرتے ہیں- مشینوں کی بڑھتی ہوئی تعداد کا انتظام کرنا بوجھ بن سکتا ہے، اور اعلی غلطی کی شرح تربیت کے نتائج کو منفی طور پر متاثر کر سکتی ہے۔ ٹریننگ میں کلسٹر پیمانے کے مخصوص تقاضے بھی ہوتے ہیں، جبکہ تخمینہ کے لیے کلسٹرز کے مطالبات اتنے سخت نہیں ہوتے، اس طرح GPU کی ضروریات میں آسانی ہوتی ہے۔ فی الحال، Nvidia کے سنگل H20 کارڈ کی کارکردگی Huawei یا Cambrian سے زیادہ نہیں ہے۔ اس کی طاقت کلسٹرنگ میں ہے. کمپیوٹیشنل پاور مارکیٹ پر مجموعی اثرات کی بنیاد پر، لوچن ٹیکنالوجی کے بانی، یو یانگ، نے AI ٹیکنالوجی ریویو کے ساتھ ایک انٹرویو میں کہا، "DeepSeek انتہائی بڑے تربیتی کمپیوٹیشنل کلسٹرز کے قیام اور کرایے کو عارضی طور پر کمزور کر سکتا ہے۔ طویل مدت میں، لاگت کو نمایاں طور پر کم کر کے، ممکنہ طور پر ٹریننگ کی مارکیٹ کی طلب اور ماڈل کی بڑی مانگ سے منسلک ہونے کی وجہ سے اخراجات میں نمایاں کمی واقع ہو سکتی ہے۔ اس کی بنیاد پر AI کے بعد کے تکرار اس لیے کمپیوٹیشنل پاور مارکیٹ میں مسلسل مانگ کو آگے بڑھائیں گے۔" مزید برآں، "ڈیپ سیک کی استدلال اور فائن ٹیوننگ سروسز کے لیے بڑھتی ہوئی مانگ گھریلو کمپیوٹیشنل لینڈ اسکیپ کے ساتھ زیادہ مطابقت رکھتی ہے، جہاں مقامی صلاحیتیں نسبتاً کمزور ہیں، جو کلسٹر کے قیام کے بعد بیکار وسائل سے فضلہ کو کم کرنے میں مدد کرتی ہیں؛ یہ گھریلو کمپیوٹیشنل ایکو سسٹم کی مختلف سطحوں پر مینوفیکچررز کے لیے قابل عمل مواقع پیدا کرتا ہے۔" Luchen ٹیکنالوجی نے گھریلو کمپیوٹیشنل پاور پر مبنی DeepSeek R1 سیریز ریجننگ APIs اور کلاؤڈ امیجنگ سروسز شروع کرنے کے لیے Huawei Cloud کے ساتھ تعاون کیا ہے۔ یو یانگ نے مستقبل کے بارے میں امید کا اظہار کیا: "DeepSeek مقامی طور پر تیار کردہ حلوں میں اعتماد پیدا کرتا ہے، جو آگے بڑھنے والے گھریلو کمپیوٹیشنل صلاحیتوں میں زیادہ جوش اور سرمایہ کاری کی حوصلہ افزائی کرتا ہے۔"

نتیجہ
آیا ڈیپ سیک ChatGPT سے "بہتر" ہے اس کا انحصار صارف کی مخصوص ضروریات اور مقاصد پر ہے۔ لچک، کم لاگت اور حسب ضرورت کاموں کے لیے، DeepSeek بہتر ہو سکتا ہے۔ تخلیقی تحریر، عمومی استفسار، اور صارف دوست گفتگو کے انٹرفیس کے لیے، ChatGPT آگے بڑھ سکتا ہے۔ ہر ٹول مختلف مقاصد کو پورا کرتا ہے، اس لیے انتخاب کا انحصار اس سیاق و سباق پر ہوگا جس میں وہ استعمال کیے جاتے ہیں۔
کنٹرول کیبلز
سٹرکچرڈ کیبلنگ سسٹم
نیٹ ورک اور ڈیٹا، فائبر آپٹک کیبل، پیچ کی ہڈی، ماڈیولز، فیس پلیٹ
16-18 اپریل 2024 دبئی میں مشرق وسطیٰ توانائی
16 تا 18 اپریل 2024 سیکوریکا ماسکو میں
9 مئی، 2024 کو شنگھائی میں نئی مصنوعات اور ٹیکنالوجیز کا آغاز
22-25 اکتوبر، 2024 سیکورٹی چین بیجنگ میں
نومبر 19-20، 2024 عالمی KSA سے منسلک
پوسٹ ٹائم: فروری 10-2025