Llama 2 چیست و چگونه می توانید از آن استفاده کنید؟

0 خواندن این مطلب 7 دقیقه زمان میبرد

Llama 2 چیست و چگونه می توانید از آن استفاده کنید؟

از مدل GPT-4 OpenAI تا PalM 2 گوگل، مدل‌های زبان بزرگ بر عناوین فناوری حاکم هستند. هر مدل جدید نوید می‌دهد که بهتر و قدرتمندتر از مدل قبلی باشد و گاهی اوقات از هر رقابت موجودی فراتر رود.

با این حال، تعداد مدل های موجود، ظهور مدل های جدید را کند نکرده است. اکنون، Meta، شرکت مادر فیس بوک، Llama 2، یک مدل زبان قدرتمند جدید را منتشر کرده است. اما Llama 2 چه ویژگی خاصی دارد؟ چگونه با مدل هایی مانند GPT-4، PaLM 2 و Claude 2 متفاوت است و چرا باید به آن اهمیت دهید؟

Llama 2 چیست؟

Llama 2، یک مدل زبان بزرگ، محصول یک اتحاد غیرمعمول بین Meta و مایکروسافت، دو غول فناوری رقیب در خط مقدم تحقیقات هوش مصنوعی است. این جانشین مدل زبان Llama 1 Meta است که در سه ماهه اول سال ۲۰۲۳ منتشر شد. می توانید بگویید که این معادل Meta برای PaLM 2 گوگل، GPT-4 OpenAI و Claude 2 Anthropic است. این مدل با استفاده از مجموعه داده عظیمی از داده های اینترنتی در دسترس عموم آموزش دیده است و از مزیت مجموعه داده ای که هم جدیدتر و هم متنوع تر از داده های مورد استفاده برای آموزش Llama 1 است، بهره می برد. Llama 2 با ۴۰ درصد داده بیشتر نسبت به نسخه قبلی خود آموزش دیده است و طول متن آن دو برابر شده است.

اگر در گذشته فرصتی برای تعامل با Llama 1 داشته اید اما از خروجی آن خیلی تحت تأثیر قرار نگرفته اید، Llama 2 از نسخه قبلی خود عملکرد بهتری دارد و ممکن است دقیقاً همان چیزی باشد که نیاز دارید. اما عملکرد آن در مقابل رقابت خارجی چگونه است؟

Llama 2 چگونه در رقابت می ایستد؟

خب، بستگی به رقابت دارد. اولاً Llama 2 یک پروژه متن باز است. این بدان معناست که Meta کل مدل را منتشر می کند، بنابراین هر کسی می تواند از آن برای ساخت مدل ها یا برنامه های جدید استفاده کند. اگرLlama 2 را با سایر مدل های زبان متن باز بزرگ مانند Falcon یا MBT مقایسه کنید، متوجه خواهید شد که در چندین معیار از آنها عملکرد بهتری دارد. می توان با خیال راحت گفت که Llama 2 یکی از قدرتمندترین مدل های زبان بزرگ متن باز در بازار امروز است. اما چگونه با غول هایی مانند GPT OpenAI و خط PalM AI گوگل رقابت می کند؟ ما ChatGPT، Bard و Llama 2 را بر اساس عملکرد آنها در آزمون های خلاقیت، استدلال ریاضی، قضاوت عملی و مهارت های برنامه نویسی ارزیابی کردیم.

۱٫ خلاقیت

برای آزمایش خلاقیت و حس شوخ طبعی آن، تست خلاقیت و طنز منحصر به فرد خود را به آن دادیم. از مدل هوش مصنوعی Llama 2 خواستیم تا گفتگویی بین دو نفر را که در مورد مزایای رفتن به فضا بحث می کنند، شبیه سازی کند و در اینجا نتایج آمده است. با قضاوت از نتایج مقایسه ChatGPT، Bing AI و Google، جایی که ما از همان تست نیز استفاده کردیم، تنها پاسخ ChatGPT به طور قابل توجهی بهتر از پاسخ Llama 2 است. به نظر می رسد پاسخ Llama 2 نسبت به Bard گوگل نسبتاً بهتر است. پس از قرار دادن چت بات ها در چندین کار خلاقانه، مشخص است که ChatGPT هنوز هم بهترین از نظر خلاقیت است، اما Llama چندان از بقیه گروه عقب نیست.

۲٫ مهارت های برنامه نویسی

هنگامی که توانایی های برنامه نویسی Llama 2 را با ChatGPT و Bard مقایسه کردیم، Llama 2 پتانسیل بزرگی نشان داد. از هر سه چت بات AI خواستیم تا یک برنامه لیست کارهای کاربردی ایجاد کنند، یک بازی ساده Tetris بنویسند و یک سیستم احراز هویت امن برای یک وب سایت ایجاد کنند. در حالی کهChatGPT تقریباً در هر سه کار عملکرد کاملی ارائه کرد، Bard و Llama 2 عملکرد مشابهی داشتند و هر دو فقط قادر به ارائه کد کاربردی برای یک لیست کار و سیستم احراز هویت بودند اما در بازی Tetris شکست خوردند. در زیر تصویری از برنامه لیست کارهای Llama 2 آورده شده است.

۳٫ مهارت های ریاضی

در مهارت های ریاضی، Llama 2 نیز در مقایسه با Bard نویدبخش بود، اما در مسائل ریاضی جبر و منطق که برای آزمون خود استفاده کردیم، توسط ChatGPT به شدت شکست خورد. جالب اینجاست که Llama 2 بسیاری از مسائل ریاضی را حل کرد که ChatGPT و Bard در نسخه های اولیه خود موفق به حل آنها نشده بودند. با خیال راحت می توان گفت که Llama 2 در مهارت های ریاضی نسبت به ChatGPT پایین تر است اما پتانسیل قابل توجهی نشان می دهد.

۴٫ درک عمومی و استدلال منطقی

درک عمومی زمینه ای است که بسیاری از چت بات ها هنوز با آن دست و پنجه نرم می کنند، حتی چت بات های تثبیت شده مانند ChatGPT. ما ChatGPT، Bard و Llama 2 را موظف کردیم تا مجموعه ای از مشکلات درک عمومی و استدلال منطقی را حل کنند. باز هم، ChatGPT به طور قابل توجهی از هر دو Bard و Llama 2 فراتر رفت. رقابت بین Bard و Llama 2 بود و Bard در آزمون ما برتری جزئی نسبت به Llama 2 داشت.

واضح است که Llama 2 هنوز به آنجا نرسیده است. با این حال، باید گفت که Llama 2 نسبتاً جدید است، عمدتا یک “مدل بنیادی” است و نه یک “تنظیم دقیق”. مدل‌های بنیادی مدل‌های زبان بزرگی هستند که با در نظر گرفتن تطبیق‌های احتمالی آینده ساخته شده‌اند. آنها برای هیچ حوزه خاصی تنظیم نشده اند، اما برای انجام طیف گسترده ای از وظایف ساخته شده اند، اگرچه گاهی اوقات با توانایی های محدود. از سوی دیگر، یک مدل تنظیم شده یک مدل بنیادی است که برای افزایش کارایی آن در یک حوزه خاص تنظیم شده است. این مانند گرفتن یک مدل بنیادی مانند GPT و تنظیم دقیق آن به ChatGPT است تا عموم مردم بتوانند از آن در برنامه های چت استفاده کنند.

نحوه استفاده از Llama 2 در حال حاضر

ساده ترین راه برای استفاده از Llama 2 از طریق پلتفرم Poe AI Quora یا یک نمونه Hugging Faceمبتنی بر ابر است. همچنین می توانید با دانلود نسخه ای از آن و اجرای آن به صورت محلی، مدل را در اختیار خود بگیرید.

دسترسی به Llama در Quora Poe

برای دسترسی به Llama در پلتفرم Poe AI Quora:

به poe.com بروید و برای ایجاد حساب رایگان ثبت نام کنید. برای نشان دادن رابط انتخاب مدل هوش مصنوعی وارد حساب کاربری خود شوید. درست بالای فیلد ورودی، روی گزینه “بیشتر” کلیک کنید تا مدل های هوش مصنوعی موجود را نشان دهید. هر کدام از مدل های Llama 2 موجود را انتخاب کنید و شروع به کار کنید.

دسترسی به Llama در Hugging Face

برای دسترسی به Llama در Hugging Face، لینک مربوط به مدل های Llama 2 مربوطه را باز کنید و شروع به یادآوری چت بات AI کنید.

۱٫ ۷B parameters Llama-2 chat

۲٫ ۱۳B parameters Llama-2 chat

۳٫ ۷۰B parameters Llama-2 chat

مدل های Llama بالا و مدل های روی پلتفرم Poe برای برنامه های گفتگو تنظیم شده اند، بنابراین نزدیکترین مدل به ChatGPT که برای مدل Llama-2 دریافت می کنید، همین است. مطمئن نیستید کدام نسخه را امتحان کنید؟ ما گزینه سوم، چت Llama-2 با ۷۰B پارامتر را توصیه می کنیم. شما هنوز هم می توانید هر سه مدل را امتحان کنید تا ببینید کدام یک برای نیازهای منحصر به فرد شما بهتر کار می کند.

اگرچه ما توصیه می کنیم برای استفاده کامل از قدرت محاسبات از راه دور هنگام استفاده از HuggingFaceیا Poe با بزرگترین مدل موجود شروع کنید، برای کسانی که قصد دارند Llama 2 را به صورت محلی اجرا کنند، توصیه می کنیم با مدل پارامتر ۷B شروع کنید، زیرا این مدل کمترین نیازهای سخت افزاری را دارد.

نیازهای سخت افزاری برای اجرای محلی Llama 2

برای عملکرد بهینه با مدل ۷B، ما یک کارت گرافیک با حداقل ۱۰ گیگابایت VRAM توصیه می کنیم، اگرچه افراد گزارش کرده اند که با ۸ گیگابایت رم هم کار می کند. هنگام اجرای محلی، انتخاب منطقی بعدی مدل پارامتر ۱۳B خواهد بود. برای این کار، می توانید برای لذت بردن از توانایی های آنها، به سراغ GPU های مصرفی سطح بالا مانند RTX 3090 یا RTX 4090 بروید. با این حال، شما هنوز هم می توانید کامپیوتر ویندوز میان رده یا مک بوک خود را برای اجرای این برنامه آماده کنید. اگر می خواهید با تمام توان حرکت کنید، می توانید به سراغ بزرگترین مدل بروید. با این حال، این به سخت افزار درجه سازمانی برای عملکرد بهتر نیاز دارد. با درجه سازمانی، ما در مورد سخت افزاری در حد ballpark یک NVIDIA A100 با ۸۰ گیگابایت حافظه صحبت می کنیم. مدل پارامتر ۷۰B برای اجرای پاسخگو به سخت افزار تخصصی و فوق العاده قدرتمند نیاز دارد. یک بار دیگر، روشن کردن این نکته مهم است که شما هنوز هم می توانید این مدل را روی یک ماشین کم قدرت اجرا کنید. با این حال، زمان پاسخ ممکن است عذاب آور کند باشد و به چند دقیقه در هر درخواست برسد. قبل از انتخاب مدل مناسب برای نیازهای خود، الزامات GPU و حافظه را به دقت در نظر بگیرید. یا از نمونه HuggingFace استفاده کنید.

اگر سخت افزار و عمق فنی برای اجرای مدل Llama 2 به صورت محلی در دستگاه خود دارید، می توانید با استفاده از فرم درخواست دسترسی Llama Meta، درخواست دسترسی به مدل را بدهید. پس از ارائه نام، ایمیل، مکان و نام سازمان خود، Meta درخواست شما را بررسی می کند و پس از آن دسترسی ظرف چند دقیقه تا دو روز رد یا اعطا می شود.

Llama 2 : اولین گام مهم

Llama 2 ممکن است پیشرفته ترین مدل زبان موجود نباشد، اما با منبع باز بودن، گام اول مهمی در جهت توسعه هوش مصنوعی شفاف و مترقی را نشان می دهد.
در حالی که مدل هایی مانند OpenAI GPT در حال حاضر عملکرد بهتری دارند، رویکرد OpenAI به توسعه به معنای کنترل شرکت بر رشد و سرعت توسعه مدل است. با یک مدل منبع باز مانند Llama، جامعه منبع باز گسترده تر می تواند به صورت مکرر نوآوری کند تا محصولات جدیدی را ایجاد کند که ممکن است در یک سیستم بسته امکان پذیر نباشد.

احمد شاتقی

0 خواندن این مطلب 7 دقیقه زمان میبرد