Microsoft faz uma descoberta em legendagem de imagens assistida por IA

Embora a maioria dos internautas considere as imagens apresentadas com a maior parte do conteúdo online como certas, as informações visuais fornecidas podem aprimorar muito a experiência de consumo de conteúdo, bem como melhorar a compreensão da leitura. Para os cegos ou deficientes visuais, imagens sem legendas precisas ou texto alternativo podem dificultar a compreensão ou o consumo. Em um esforço para tornar o conteúdo mais acessível a todos os usuários em potencial, os membros da equipe do Azure da Microsoft têm desenvolvido sistemas de IA que são capazes de adicionar legendas ou texto alternativo com precisão às imagens automaticamente. Em muitos casos, essas legendas geradas por computador são de qualidade superior às fornecidas pelas pessoas.

Em uma nova postagem publicada hoje em seu AI Blog, a Microsoft detalha o recente avanço da AI que mudará a forma como as imagens serão legendadas. Suas equipes de pesquisa têm trabalhado arduamente no refinamento e aperfeiçoamento do reconhecimento de IA de novos objetos e identificação de ações. Casar os resultados desta pesquisa com a linguagem gerada por IA é a base para a legendagem automática de imagens.

Treinar o modelo de IA para tal tarefa envolve alimentar centenas de milhares de imagens em um conjunto de dados, com cada imagem sendo acompanhada por marcas de palavras em vez de legendas completas. É semelhante a como você ensinaria uma criança pequena com a associação de palavras. A imagem de uma maçã é inserida no modelo junto com a tag “ apple. ” Uma vez que o modelo tenha sido suficientemente treinado para reconhecer objetos e ações individuais, a equipe começou a ensiná-lo a criar frases legíveis com base em seu vocabulário recém-adquirido.

O novo modelo agora está disponível como parte do pacote de Serviços Cognitivos do Azure e será implantado no Microsoft Word, Outlook, Powerpoint e outros aplicativos ainda este ano.

Nenhum comentário