Groq
توفر Groq استدلال ذكاء اصطناعي فائق السرعة مدعومًا بعتاد LPU (وحدة معالجة اللغة) المخصص. لا تقوم Groq بتدريب نماذجها الخاصة -- بدلاً من ذلك، تشغل نماذج مفتوحة المصدر شائعة بسرعات أعلى بكثير من بنية GPU التقليدية. عدة نماذج متاحة مجانًا مع حدود سرعة.
الحصول على مفتاح API
- قم بزيارة console.groq.com/keys
- سجل الدخول أو أنشئ حسابًا (مجاني)
- أنشئ مفتاح API جديد (يبدأ بـ
gsk_...) - الصق المفتاح في AISCouncil تحت الإعدادات > نموذج AI > Groq
تقدم Groq مستوى مجاني مع حدود سرعة سخية. لا حاجة لبطاقة ائتمان لإنشاء حساب والبدء في استخدام النماذج المجانية.
يتم تخزين مفاتيح API محليًا في متصفحك (localStorage) ولا يتم تضمينها أبدًا في عناوين URL للبوتات المشتركة.
النماذج المدعومة
النماذج المجانية
| النموذج | نافذة السياق | الحد الأقصى للمخرجات | القدرات |
|---|---|---|---|
| Llama 3.3 70B | 128K | 32K | الأدوات، الكود، التدفق |
| DeepSeek R1 Distill 70B | 128K | 16K | الاستدلال، الكود، التدفق |
| Compound Beta | 128K | 32K | الأدوات، الاستدلال، التدفق |
| Llama 3.1 8B Instant | 128K | 8K | الأدوات، الكود، التدفق |
| Gemma 2 9B | 8K | 8K | التدفق |
النماذج المدفوعة
| النموذج | نافذة السياق | الحد الأقصى للمخرجات | سعر الإدخال | سعر المخرجات | القدرات |
|---|---|---|---|---|---|
| Llama 4 Scout | 128K | 8K | $0.11/MTok | $0.34/MTok | الرؤية، الأدوات، الكود |
| Llama 4 Maverick | 128K | 8K | $0.50/MTok | $0.77/MTok | الرؤية، الأدوات، الكود |
| Qwen3 32B | 128K | 8K | $0.29/MTok | $0.59/MTok | الأدوات، الاستدلال |
الأسعار لكل مليون رمز (MTok).
النماذج المجانية لها حدود سرعة تختلف حسب النموذج ومستوى الحساب. الحدود النموذجية:
- طلبات في الدقيقة: 30
- رموز في الدقيقة: 6,000-15,000
- طلبات في اليوم: 1,000-14,400
تحقق من console.groq.com للحدود الحالية على حسابك.
لماذا Groq سريع
تستخدم Groq رقائق LPU (وحدة معالجة اللغة) مصممة خصيصًا بدلاً من GPU. تم بناء LPU خصيصًا لتوليد الرموز المتسلسلة، وهو عنق الزجاجة في استدلال LLM. النتيجة:
- الوقت لأول رمز: غالبًا أقل من 100ms
- سرعة توليد الرموز: 500-800+ رمز/ثانية على العديد من النماذج
- زمن استجابة ثابت: أداء متوقع بدون تقلب تجميع GPU
هذا يجعل Groq مثاليًا للتطبيقات حيث سرعة الاستجابة أهم من حجم النموذج.
دعم الاستدلال
DeepSeek R1 Distill 70B و Compound Beta يدعمان الاستدلال، إظهار التفكير خطوة بخطوة قبل تقديم إجابة نهائية. Qwen3 32B (مدفوع) يدعم الاستدلال أيضًا.
نظرًا لأن Groq يستخدم تنسيق API المتوافق مع OpenAI، يتدفق مخرجات الاستدلال كـ reasoning_content ويظهر في كتلة تفكير قابلة للطي في المحادثة.
Compound Beta (الذكاء الاصطناعي الوكيلي)
Compound Beta هو نظام الذكاء الاصطناعي المركب من Groq الذي يجمع بين الاستدلال واستخدام الأدوات. يمكنه تنفيذ مهام متعددة الخطوات من خلال التخطيط والاستدلال واستخدام الأدوات بالتسلسل. هذا النموذج مجاني ومتاح بمفتاح Groq API.
دعم الرؤية
النماذج المدفوعة Llama 4 Scout و Llama 4 Maverick تدعم إدخال الرؤية. يمكنك لصق أو رفع أو سحب وإفلات الصور لهذه النماذج.
النماذج المجانية على Groq لا تدعم الرؤية حاليًا.
استدعاء الأدوات
معظم نماذج Groq تدعم استدعاء الدوال/الأدوات عبر تنسيق OpenAI-compatible. يشمل ذلك النماذج المجانية Llama 3.3 70B و Compound Beta.
API المتوافق مع OpenAI
يستخدم Groq واجهة API متوافقة تمامًا مع OpenAI:
- نقطة نهاية
POST /openai/v1/chat/completionsالقياسية علىapi.groq.com - مصادقة Bearer token
- تدفق SSE
- استدعاء الدوال/الأدوات
لا حاجة لتكوين خاص.
الإعدادات
عند إنشاء ملف تعريف بوت، اختر Groq كمزود واختر نموذجك المفضل. يمكنك تعيين مفتاح API لكل بوت في لوحة إعدادات البوت لتجاوز المفتاح العام.
يستخدم مزود Groq واجهة Chat Completions API على api.groq.com/openai/v1/chat/completions.
الأفضل لـ
| حالة الاستخدام | النموذج الموصى به |
|---|---|
| محادثة حساسة للسرعة | Llama 3.3 70B (مجاني) |
| استدلال سريع | DeepSeek R1 Distill 70B (مجاني) |
| سير عمل وكيلي | Compound Beta (مجاني) |
| مهام خفيفة | Llama 3.1 8B Instant (مجاني) |
| مهام الرؤية | Llama 4 Scout أو Maverick (مدفوع) |
| كود + استدلال | Qwen3 32B (مدفوع) |
نصائح لأفضل النتائج
- استخدم Groq عندما تكون السرعة مهمة. إذا كنت بحاجة لأسرع استجابات ممكنة ويمكنك العمل مع نماذج مفتوحة المصدر، Groq هو الخيار الأفضل.
- ابدأ بـ Llama 3.3 70B. مجاني وسريع وقادر -- أفضل نموذج أغراض عامة مجاني على Groq.
- استخدم DeepSeek R1 Distill للاستدلال. يوفر استدلال قوي لسلسلة الأفكار مجانًا، بسرعات Groq.
- اقرن مع مزودين آخرين في المجالس. سرعة Groq تجعله عضو استجابة سريعة ممتاز في المجالس متعددة النماذج، حيث يمكنه تقديم إجابات أولية سريعة تقوم النماذج الأبطأ والأقوى بتحسينها.
- انتبه لحدود السرعة. يمكن الوصول إلى حدود سرعة المستوى المجاني بسرعة في الاستخدام عالي الحجم. وزع الطلبات عبر الوقت أو قم بالترقية إلى خطة مدفوعة لحدود أعلى.