محققان شرکت مایکروسافت به انتشار جزئیاتی در مورد فناوری جدید تشخیص صدا از سوی این شرکت پرداختهاند که به ادعای آنها، مثل انسان میتواند کلام محاورهای را رونویسی کند.
به گزارش بولتن نیوز به نقل از کوارتز، این محققان در بیانیهای اعلام کردند: ما به سطح برابری با انسان دست یافتیم که دستاوردی تاریخی به شمار میرود.
نرخ اشتباه واژه این سیستم 5.9 درصد است که به گفته مایکروسافت، تقریبا برابر با رونویسیکنندههای حرفهای است که بر روی سخنان برگرفته از کلام محاوره کار میکنند. این سیستم از مدلهای زبان عصبی استفاده میکند که کلمات مشابه را گروهبندی میکنند.
مایکروسافت قصد دارد از این فناوری در دستیار صوتی این شرکت موسوم به "کورتانا" (Cortana) استفاده کند که برای ویندوز و ایکسباکس وان و همچنین فناوری تبدیل کلام به نوشتار طراحی شده است.
البته مایکروسافت هنوز باید بر روی این فناوری کار بیشتری انجام داده و آن را با طیف گستردهتری از مکالمات واقعی و بر روی صداهای متنوعتر سازگار کند. برای مثال، استفاده از این سیستم بر روی فناوری کورتانا با چالش آموزش هوش مصنوعی برای یادگیری معنی واژهها و نه فقط شنیدن صحیح آنها روبرو خواهد بود.