إنتقل إلى المحتوى الرئيسي

Groq

توفر Groq استدلال ذكاء اصطناعي فائق السرعة مدعومًا بعتاد LPU (وحدة معالجة اللغة) المخصص. لا تقوم Groq بتدريب نماذجها الخاصة -- بدلاً من ذلك، تشغل نماذج مفتوحة المصدر شائعة بسرعات أعلى بكثير من بنية GPU التقليدية. عدة نماذج متاحة مجانًا مع حدود سرعة.

الحصول على مفتاح API

  1. قم بزيارة console.groq.com/keys
  2. سجل الدخول أو أنشئ حسابًا (مجاني)
  3. أنشئ مفتاح API جديد (يبدأ بـ gsk_...)
  4. الصق المفتاح في AISCouncil تحت الإعدادات > نموذج AI > Groq
المستوى المجاني

تقدم Groq مستوى مجاني مع حدود سرعة سخية. لا حاجة لبطاقة ائتمان لإنشاء حساب والبدء في استخدام النماذج المجانية.

يتم تخزين مفاتيح API محليًا في متصفحك (localStorage) ولا يتم تضمينها أبدًا في عناوين URL للبوتات المشتركة.

النماذج المدعومة

النماذج المجانية

النموذجنافذة السياقالحد الأقصى للمخرجاتالقدرات
Llama 3.3 70B128K32Kالأدوات، الكود، التدفق
DeepSeek R1 Distill 70B128K16Kالاستدلال، الكود، التدفق
Compound Beta128K32Kالأدوات، الاستدلال، التدفق
Llama 3.1 8B Instant128K8Kالأدوات، الكود، التدفق
Gemma 2 9B8K8Kالتدفق

النماذج المدفوعة

النموذجنافذة السياقالحد الأقصى للمخرجاتسعر الإدخالسعر المخرجاتالقدرات
Llama 4 Scout128K8K$0.11/MTok$0.34/MTokالرؤية، الأدوات، الكود
Llama 4 Maverick128K8K$0.50/MTok$0.77/MTokالرؤية، الأدوات، الكود
Qwen3 32B128K8K$0.29/MTok$0.59/MTokالأدوات، الاستدلال

الأسعار لكل مليون رمز (MTok).

حدود سرعة النماذج المجانية

النماذج المجانية لها حدود سرعة تختلف حسب النموذج ومستوى الحساب. الحدود النموذجية:

  • طلبات في الدقيقة: 30
  • رموز في الدقيقة: 6,000-15,000
  • طلبات في اليوم: 1,000-14,400

تحقق من console.groq.com للحدود الحالية على حسابك.

لماذا Groq سريع

تستخدم Groq رقائق LPU (وحدة معالجة اللغة) مصممة خصيصًا بدلاً من GPU. تم بناء LPU خصيصًا لتوليد الرموز المتسلسلة، وهو عنق الزجاجة في استدلال LLM. النتيجة:

  • الوقت لأول رمز: غالبًا أقل من 100ms
  • سرعة توليد الرموز: 500-800+ رمز/ثانية على العديد من النماذج
  • زمن استجابة ثابت: أداء متوقع بدون تقلب تجميع GPU

هذا يجعل Groq مثاليًا للتطبيقات حيث سرعة الاستجابة أهم من حجم النموذج.

دعم الاستدلال

DeepSeek R1 Distill 70B و Compound Beta يدعمان الاستدلال، إظهار التفكير خطوة بخطوة قبل تقديم إجابة نهائية. Qwen3 32B (مدفوع) يدعم الاستدلال أيضًا.

نظرًا لأن Groq يستخدم تنسيق API المتوافق مع OpenAI، يتدفق مخرجات الاستدلال كـ reasoning_content ويظهر في كتلة تفكير قابلة للطي في المحادثة.

Compound Beta (الذكاء الاصطناعي الوكيلي)

Compound Beta هو نظام الذكاء الاصطناعي المركب من Groq الذي يجمع بين الاستدلال واستخدام الأدوات. يمكنه تنفيذ مهام متعددة الخطوات من خلال التخطيط والاستدلال واستخدام الأدوات بالتسلسل. هذا النموذج مجاني ومتاح بمفتاح Groq API.

دعم الرؤية

النماذج المدفوعة Llama 4 Scout و Llama 4 Maverick تدعم إدخال الرؤية. يمكنك لصق أو رفع أو سحب وإفلات الصور لهذه النماذج.

النماذج المجانية على Groq لا تدعم الرؤية حاليًا.

استدعاء الأدوات

معظم نماذج Groq تدعم استدعاء الدوال/الأدوات عبر تنسيق OpenAI-compatible. يشمل ذلك النماذج المجانية Llama 3.3 70B و Compound Beta.

API المتوافق مع OpenAI

يستخدم Groq واجهة API متوافقة تمامًا مع OpenAI:

  • نقطة نهاية POST /openai/v1/chat/completions القياسية على api.groq.com
  • مصادقة Bearer token
  • تدفق SSE
  • استدعاء الدوال/الأدوات

لا حاجة لتكوين خاص.

الإعدادات

عند إنشاء ملف تعريف بوت، اختر Groq كمزود واختر نموذجك المفضل. يمكنك تعيين مفتاح API لكل بوت في لوحة إعدادات البوت لتجاوز المفتاح العام.

يستخدم مزود Groq واجهة Chat Completions API على api.groq.com/openai/v1/chat/completions.

الأفضل لـ

حالة الاستخدامالنموذج الموصى به
محادثة حساسة للسرعةLlama 3.3 70B (مجاني)
استدلال سريعDeepSeek R1 Distill 70B (مجاني)
سير عمل وكيليCompound Beta (مجاني)
مهام خفيفةLlama 3.1 8B Instant (مجاني)
مهام الرؤيةLlama 4 Scout أو Maverick (مدفوع)
كود + استدلالQwen3 32B (مدفوع)

نصائح لأفضل النتائج

  • استخدم Groq عندما تكون السرعة مهمة. إذا كنت بحاجة لأسرع استجابات ممكنة ويمكنك العمل مع نماذج مفتوحة المصدر، Groq هو الخيار الأفضل.
  • ابدأ بـ Llama 3.3 70B. مجاني وسريع وقادر -- أفضل نموذج أغراض عامة مجاني على Groq.
  • استخدم DeepSeek R1 Distill للاستدلال. يوفر استدلال قوي لسلسلة الأفكار مجانًا، بسرعات Groq.
  • اقرن مع مزودين آخرين في المجالس. سرعة Groq تجعله عضو استجابة سريعة ممتاز في المجالس متعددة النماذج، حيث يمكنه تقديم إجابات أولية سريعة تقوم النماذج الأبطأ والأقوى بتحسينها.
  • انتبه لحدود السرعة. يمكن الوصول إلى حدود سرعة المستوى المجاني بسرعة في الاستخدام عالي الحجم. وزع الطلبات عبر الوقت أو قم بالترقية إلى خطة مدفوعة لحدود أعلى.