تاریخ انتشار: سه شنبه 1403/09/13 - 12:13
کد خبر: 524213

تصویرسازی هوش مصنوعی از خیابان‌ها با گوش دادن به صدای آنها

 تصویرسازی هوش مصنوعی از خیابان‌ها با گوش دادن به صدای آنها

هر خیابانی صدای خاص خود را دارد که اکنون هوش مصنوعی می‌تواند از شنیدن آن برای تولید تصاویر آنها استفاده کند.

به گزارش «خبرنامه دانشجویان ایران»؛ در حالی که هم اکنون مدل‌های هوش مصنوعی وجود دارند که جلوه‌های صوتی را برای مطابقت با تصاویر بی‌صدا از خیابان‌ها و مکان‌های دیگر تولید می‌کنند، یک فناوری جدید آزمایشی دقیقاً برعکس عمل می‌کند و تصاویر را با دقت عجیبی از صدای خیابان‌ها تولید می‌کند.

به نقل از نیو اطلس، پروفسور یوهائو کانگ و همکارانش از دانشگاه تگزاس در آستین، یک مدل تبدیل صدا به تصویر را بر روی مجموعه داده‌ای از کلیپ‌های صوتی و تصویری ۱۰ ثانیه‌ای آموزش داده‌اند.

این کلیپ‌ها شامل تصاویر ثابت و صدای محیطی بود که از ویدیوهای یوتیوب از خیابان‌های شهری و روستایی در آمریکای شمالی، آسیا و اروپا گرفته شده بود.

این سیستم با استفاده از الگوریتم‌های یادگیری عمیق، نه تنها یاد گرفت که کدام صداها با کدام موارد درون تصاویر مطابقت دارند، بلکه همچنین تشخیص داد که کیفیت صدا با کدام محیط بصری مطابقت دارد.

هنگامی که آموزش این سیستم کامل شد، هوش مصنوعی وظیفه تولید تصاویر را بر اساس صدای محیطی ضبط شده از ۱۰۰ کلیپ دیگر که از خیابان‌ها ضبط شده بود، بر عهده گرفت و برای هر ویدیو یک تصویر تولید کرد.

متعاقباً گروهی از داوران انسانی هر یک از آن تصاویر را در کنار دو تصویر تولید شده از خیابان‌های دیگر مشاهده کردند، در حالی که به صدای ویدیویی که تصویر بر اساس آن ساخته شده بود، گوش می‌دادند. وقتی از آنها خواسته شد که تشخیص دهند کدام یک از این سه تصویر با موسیقی متن مطابقت دارد و آنها به طور متوسط ​​با ۸۰ درصد دقت تواستند تشخیص دهند.

علاوه بر این، هنگامی که تصاویر تولید شده توسط رایانه تجزیه و تحلیل شد، تصاویر تولید شده از آسمان، فضای سبز و ساختمان‌ها به شدت با تصاویر واقعی موجود در ویدئوهای اصلی مرتبط بود.

در واقع در بسیاری از موارد، تصاویر تولید شده، شرایط نوری ویدئوهای منبع، مانند آسمان آفتابی، ابری یا شبانه را نیز منعکس می‌کردند. این ممکن است با عواملی مانند کاهش صدای ترافیک در شب یا صدای حشرات شبانه امکان‌پذیر شده باشد.

اگرچه این فناوری می‌تواند کاربردهایی مانند دریافت یک ایده تقریبی از محل ضبط صدا در پزشکی قانونی داشته باشد، اما هدف این مطالعه بیشتر بررسی این است که چگونه صدا به حس مکان ما کمک می‌کند.

دانشمندان این مطالعه می‌گویند: نتایج می‌تواند دانش ما را در مورد تأثیر ادراکات دیداری و شنیداری بر سلامت روان انسان افزایش دهد و همچنین ممکن است شیوه‌های طراحی شهری را بهینه کند و کیفیت کلی زندگی در جوامع را بهبود بخشد.

این مطالعه در مجله Nature منتشر شده است.

مرتبط ها
نظرات
حداکثر تعداد کاراکتر نظر 200 ميياشد
نظراتی که حاوی توهین یا افترا به اشخاص، قومیت‌ها، عقاید دیگران باشد و یا با قوانین جمهوری اسلامی ایران و آموزه‌های دینی مغایرت داشته باشد منتشر نخواهد شد - لطفاً نظرات خود را با حروف فارسی تایپ کنید
تورهای مسافرتی آفری
چشم‌انداز تاریک مذاکرات صلح مسکو و کی‌یف
سرقت تاسیسات صنعتی حلب توسط تروریست‌ها به مقصد ترکیه
چند پیام عملیات‌های مشترک یمن و مقاومت عراق ضد اشغالگران
واکنش مشابه آمریکا و روسیه به حکومت نظامی در کره جنوبی
گرانی و تورم در اسرائیل به روایت رسانه‌های عبری زبان
مصوبه مجلس درباره تجمیع املاک دانشگاه‌ها، مؤسسات آموزشی و پژوهشی دولتی و پارک‌های علم و فناوری
اجازه مجلس به دانشگاه‌ها، مؤسسات آموزشی و پژوهشی دولتی و پارک‌های علم و فناوری برای دریافت تسهیلات بانکی
قانون جوانی جمعیت در حوزه تخصیص زمین اجرایی شود
امضای یادداشت تفاهم همکاری کنسولی بین ایران و عمان
پوتین خطاب به اردوغان: تجاوز تروریستی به سوریه متوقف شود
دومین شب مراسم عزاداری حضرت زهرا (س) با حضور رهبر انقلاب +عکس
جزئیات جلسه کمیسیون امنیت ملی درباره مذاکرات اخیر
«جوما» با استقلال به ایران آمد
مراسم قرعه کشی بیستمین دوره عمره دانشگاهیان برگزار شد
مراسم بزرگداشت روز دانشجو و یادبود آخرین حضور دانشگاهی شهید رئیسی +عکس
دومین شب عزاداری شهادت حضرت فاطمه زهرا(س)در حسینیه امام خمینی برگزار شد
جلیلی: تا وقتی یک قانون پابرجا است، نباید آن قانون را معطل کرد
ترافیک سنگین و پر حجم در اکثر معابر پایتخت
هزینه تحصیل هر دانشجوی پزشکی یک میلیارد تومان است
زاکانی: دیر یا زود به سمت استفاده از انرژی هسته ای می رویم
آمریکا تحریم‌های جدیدی علیه ایران اعمال کرد
نظرسنجی
بنظر شما باتوجه به حوادث اخیر فلسطین چقدر احتمال فروپاشی رژیم صهیونیستی وجود دارد؟




مشاهده نتایج
go to top