موتور تبدیل متن به متا تصویر معرفی شده است

اگر فکر می کنید در بین ابزارهای آنلاین سرویس ترجمه گوگل یا سرویس های جستجوی عکس بسیار قدرتمند و عجیب هستند، باید بگوییم که سخت در اشتباهید. زیرا اکنون مولد متن به تصویر معرفی شده است که امکان تبدیل متون به تصویر را فراهم می کند. با ترنجی همراه باشید

مکانیزم تبدیل متن به تصاویر متا با رویکردی خلاقانه معرفی شد

جهان قوانین متفاوتی نسبت به جهانی که در آن زندگی می کنیم خواهد داشت. تقریباً هر کسی می تواند هر چیزی را که فکرش را می کند بسازد. به یک معنا، هیچ محدودیتی وجود نخواهد داشت. اما از آنجایی که ما در مورد دنیای جدیدی صحبت می کنیم که در آن رایانه ها و مردم در کنار یکدیگر زندگی و کار خواهند کرد، منطقی است که بدانیم این همکاری چگونه توسعه خواهد یافت.

یکی از این همکاری ها تبدیل متن به تصویر است که در حال حاضر بسیار محبوب و دوست داشتنی است. به عنوان مثال، OpenAI سرویس Craiyon خود را ارائه می دهد، در حالی که گوگل از Imagen AI استفاده می کند. اخیرا متا که یکی از بازیگران پیشرو در زمینه هوش مصنوعی است، موتور تبدیل متن به تصویر مبتنی بر هوش مصنوعی خود را معرفی کرده است. همانطور که متا گفت، این موتور جدید به مردم کمک می کند تا هنر فراگیرتری را در Metaverse ایجاد کنند. بنابراین اکنون متا موتور تبدیل متن به تصویر خود را دارد.

موتوری برای تولید متا متن به تصویر

توصیف عملکرد این موتور (تبدیل متن به تصویر) روی کاغذ بسیار ساده و راحت است. به عنوان مثال، وقتی می گویید “اسبی در بیمارستان وجود دارد”، دستگاه ابتدا آن را از طریق یک مدل ترانسفورماتور و یک شبکه عصبی اجرا می کند، سپس آنچه شما گفته اید را می فهمد و درک زمینه ای از ارتباط آنها با یکدیگر ایجاد می کند. بعد از اینکه این موتور تمام مراحل ذکر شده را طی کرد و منظور شما را فهمید، با استفاده از مجموعه ای از GAN (شبکه های متخاصم مولد) به کمک هوش مصنوعی تصویری را ایجاد می کند.

  درگاه USB C مک بوک پرو 2021 از شارژ سریع پشتیبانی نمی کند

مطابق با GizChinaبا توجه به پیشرفت سیستم یادگیری ماشینی و توانایی های ویژه آن در زمینه خودآموزی، موتورهای تبدیل متن به تصویر قادرند هر الگوی طراحی تصویری را که می خواهید ایجاد کنند. می توان گفت که همه موتورها بر اساس یک اصل کار می کنند. با این حال، هر کدام از نظر پردازش هوش مصنوعی متفاوت هستند.

به عنوان مثال، Google Image یک مدل انتشار را ترجیح می دهد که ابتدا یاد می گیرد الگوی نقاط تصادفی را به تصاویر تبدیل کند. این تصاویر با وضوح پایین شروع می شوند و سپس به تدریج وضوح خود را افزایش می دهند. از سوی دیگر، Parti AI گوگل، ابتدا مجموعه‌ای از تصاویر را به دنباله‌ای از کدهای ورودی تبدیل می‌کند، دقیقاً مانند قطعات پازل. سپس یک دستور متنی به این ورودی های کد ترجمه می شود و یک تصویر جدید ایجاد می شود.

با این حال، باید توجه داشته باشید که به عنوان یک کاربر، کنترلی بر برخی از جنبه های تصویر خروجی ندارید. مارک زاکربرگ، مدیرعامل متا روز سه‌شنبه در یک پست وبلاگی گفت که برای درک پتانسیل هوش مصنوعی برای پیشبرد بیان خلاق، مردم باید بتوانند محتوایی را که یک سیستم تولید می‌کند شکل داده و کنترل کنند.

دیدگاهتان را بنویسید