小猪号 3 月 8 日消息,微软于 2021 年启动了 Project Florence,该 AI 计算机视觉模型结合 Web 图像 - 文本数据的通用视觉语言表征,可以轻松地适应分类、检索、目标检测、视觉问答(VQA)、图像描述、视频检索和动作识别等各种计算机视觉任务。
微软于今天宣布 AI 计算机视觉模型以公共预览版的形式向开发者开放。该模型已通过了数十亿个文本图像的训练,并集成了 Azure 视觉认知服务,在注重成本的前提下,为各个行业提供可靠、经济高效且满足市场需求的视觉应用程序。
微软客户借助 Florence 可以更轻松地将数据数字化,同时从图像和视频内容中获得有价值的见解。这有助于为用户提供可访问的内容,优化 SEO 以获得更高的获取量,保护用户免受任何潜在有害内容的侵害,增强安全性,并允许更快的事件响应时间。
Florence 通过自动字幕、智能裁剪、分类、消除背景干扰和图像搜索提供用户友好的内容发现。更重要的是,用户可以通过符合道德规范的 AI 实施来跟踪运动、评估周围环境并获得即时通知。
小猪号附微软原文:Announcing a renaissance in computer vision AI with Microsoft's Florence foundation model