Lex, Polly e Rekognition, i nuovi servizi AI disponibili all’interno dell’offerta AWS Amazon Web Services

Permetteranno agli sviluppatori aziendali di creare con facilità mobile App o software in grado di interagire con l’ambiente circostante analizzando immagini o parlando con l’utente

Pubblicato il 23 Dic 2016

shutterstock_119807125

shutterstock_119807125

AWS Amazon Web Services ha presentato nei giorni scorsi tre servizi per l’intelligenza artificiale (AI), che semplificano il lavoro degli sviluppatori nella creazione di applicazioni in grado di apprendere il linguaggio naturale, convertire i testi in discorsi parlati, effettuare conversazioni vocali o sotto forma di testo. Gli stessi servizi permetteranno anche di semplificare la creazione di applicazioni dedicate all’analisi delle immagini, al riconoscimento di volti, oggetti o scene.

Amazon Lex, Amazon Polly, e Amazon Rekognition offrono capacità di IA sono tutti basati sulla stessa tecnologia collaudata e scalabile di Amazon, costruita da migliaia di esperti dell’azienda specializzati nelle tecnologie di apprendimento automatico. Inoltre, sono offerti come servizi gestiti, pertanto gli sviluppatori non dovranno creare specifici algoritmi di deep learning o modelli di machine learning, né effettuare investimenti nell’infrastruttura o impegnarsi nell’up-front.

Amazon Lex è la tecnologia che va ad arricchire le funzionalità dell’assistente vocale di Amazon (Alexa). Permette di creare interfacce utente di tipo conversazionale particolarmente ricche, da integrare all’interno di applicazioni web, mobile e per device connessi in ottica applicativa Internet of Things.

Amazon Polly trasforma i testi in linguaggio parlato, lavora sulle interfacce conversazionali e permette alle applicazioni di parlare con 47 tipologie diverse di toni di voce il 24 lingue differenti.

Amazon Rekognition permette di aggiungere con facilità funzionalità di analisi delle immagini e delle foto alle applicazioni, utilizzando funzionalità avanzate di riconoscimento facciale e deep learning delle immagini (una branca del machine learning che si occupa di modellizzare i dati destrutturati che compongono le immagini).

Le funzionalità di artificial intelligence di Amazon sono disponibili sotto forma di servizio all’interno del bouquet di offerta degli AWS (Amazon Web Services), così non è richiesto alle aziende alcuno sforzo tecnologico in termini di infrastrutture abilitanti o training specifico per utilizzarne da subito le funzionalità. Questo permette, quindi, alle persone che in azienda si occupano di sviluppare applicazioni di poter sperimentare tutta una serie di nuove App e software in grado di vedere, ascoltare, parlare e addirittura “capire”, per interagire al massimo con l’ambiente circostante.

L’applicazione effettiva dell’intelligenza artificiale implica uno sforzo notevole per lo sviluppo e il tuning delle diverse tipologie di algoritmi di machine e deep learning (riconoscimento vocale automatico, comprensione del linguaggio naturale, classificazione delle immagini…), la raccolta e pulizia dei dati o il fine tuning dei modelli di machine learning. Queste procedure devono, poi, essere ripetute per ciascun oggetto, faccia, voce e linguaggio di ciascuna applicazione. I nuovi servizi Amazon eliminano tutte queste incombenze perché le funzionalità relative saranno “a portata di click”, all’interno della AWS Management Console.

Conversazioni intelligenti con Amazon Lex

shutterstock_94408579

Amazon Lex è un nuovo servizio per creare interfacce di conversazione che combinano testo e voce basate sulla stessa tecnologia di riconoscimento del linguaggio che sta al cuore dell’assistente vocale di Amazon (Alexa). Gli sviluppatori potranno sviluppare bots (app che gestiscono conversazioni per compiere in automatico attività come verificare il meteo o prenotare voli) direttamente dalla AWS Management Console, semplicemente digitando una serie di frasi semplici tipo “cerca volo” oppure “prenota volo” e alcune informazioni a corredo (come l’indicazione della destinazione del volo). Amazon Lex si occuperà di tutto il resto, creando il linguaggio di modellizzazione e definendo le domande di follow-up necessarie per completare il task. Amazon Lex è integrato in AWS Lambda, così che sarà possibile configurarlo per invocare i servizi di backend appropriati (ad esempio, il sistema di prenotazione voli) attraverso una funzione Lambda. Gli sviluppatori potranno anche utilizzare connettori enterprise preconfigurati, che eseguono le funzionalità di Lambda per rispondere a domande del tipo “quali sono i miei 10 account top all’interno di Salesforce.com?”, recuperando i dati dai sistemi in uno in azienda come Microsoft Dynamics, Marketo, Zendesk o HubSpot.

Dialoghi intelligenti con Amazon Polly

Con Amazon Polly gli sviluppatori saranno in grado di aggiungere funzionalità di dialogo con linguaggio pseudo naturale alle proprie applicazioni di e-learning oppure ai newsreader o, ancora, crearne di nuove per piattaforme mobile o appliance IoT. Utilizzarlo è molto semplice: sarà sufficiente inviare il testo da convertire a Polly, attraverso il Software Development Kit di Amazon oppure tramite la AWS Management Console, e Polly restituirà immediatamente lo streaming audio. Il servizio ha un database di 47 toni di voce (tra maschili e femminili) in 24 lingue diverse.

Analisi immagini “smart” con Amazon Rekognition

shutterstock_396578755

Amazon Rekognition permette di creare applicazioni che analizzano le immagini, riconoscono volti, oggetti e panorami. Il servizio utilizza le tecnologie di deep learning per identificare automaticamente gli oggetti e le scene – veicoli, animali, mobile – fornendo un sistema di scoring che permette agli sviluppatori di taggare le immagini, in modo che le applicazioni siano in grado di ricercare automaticamente l’immagine utilizzando delle keyword. Con Amazon Rekognition sarà possibile identificare in automatico alcuni attributi e comprendere se una faccia è felice o meno e se due facce con espressioni differenti sono associate alla stessa persona, il tutto in tempo reale.

In aggiunta a questi servizi, AWS ha recentemente annunciato di aver investito in MXNet, un framework open source per il deep learning distribuito inizialmente sviluppato da un pool di ricercatori universitari della Carnegie Mellon.

Le funzionalità di deep e machine learning sono disponibili anche all’interno dell’Amazon Elastic Compute Cloud (Amazon EC2) e tra le realtà che si sono dette pronte a utilizzarle troviamo Motorola e l’Ente Aerospaziale Americano (NASA).

23 Dicembre 2016

L’automobile Fiat? Si compra su Amazon.it con e-commerce e IoT

Amazon: Milano, Roma e Trieste: ecco le province dove l’Internet of Things è di casa

Cloud IoT: Microsoft si allea con GE per integrare Prediz all’interno di Azure

Immagini fornite da Shutterstock

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 3