استاندارد جدید OpenAI برای سنجش هوش مصنوعی در پزشکی
OpenAI با معرفی مدل جدید HealthBench گامی نو در ارزیابی عملکرد مدلهای هوش مصنوعی در حوزه سلامت برداشته است. این مدل با همکاری ۲۶۲ پزشک از ۶۰ کشور و بر پایه ۵ هزار گفتوگوی واقعی ساخته شده و میتواند عملکرد ابزارهای هوش مصنوعی را در پاسخ به سؤالات پزشکی بهصورت دقیق و با معیارهای تخصصی بسنجد. HealthBench نهتنها رقابتی جدی میان مدلهای پیشرفته ایجاد کرده، بلکه به ابزاری راهبردی برای اعتمادسازی در حوزه سلامت دیجیتال تبدیل شده است.
|
تاریخ انتشار : ۲۳/ارديبهشت/۱۴۰۴ | ۱۶:۲۶