About

Consulting, System Integration,
Solution Providing, Products, Services.

Multimac implementa le migliori tecnologie di tracciabilità e visibilità all’interno dei flussi delle catene di approvvigionamento.
Mobile Computing per rendere informate le risorse umane in tempo reale, Cloud Labelling per la creazione del dato digitale su etichetta ovunque ci si trovi, Data Capture per l’acquisizione dati digitale in ogni nodo della Supply Chain, RFID per la migliore visibilità in tempo reale di prodotti e asset, Real Time Locating System per visualizzare in tempo reale gli spostamenti, Data Intelligence per la migliore gestione dei flussi attraverso lo studio dei dati acquisiti.

Contatti

Email: info@multimac.it
Numero Verde: 800 593 293

Multimac Srl
Via W. Baffin, 10
35136 Padova - Italy
Telefono: +39 049 713 267
Fax: +39 049 713 582
Codice fiscale: 01633140239
Partita IVA: IT01281830289
Sdi: M5UXCR1
Anno di fondazione: 1976
R.E.A. : PD – 196842

01 marzo 2024

Il deep learning OCR presente nei sistemi di visione Zebra garantisce la migliore sicurezza nella tracciabilità end-to-end.

Ottienere una comprensione completa dello strumento di lettura del testo basato sull'intelligenza artificiale, del riconoscimento ottico dei caratteri (OCR) con deep learning, del suo confronto con l'OCR convenzionale e del suo utilizzo per garantire la qualità e lo stato dei prodotti in diverse situazioni della catena di approvvigionamento. L'esperto di Zebra in Fixed Industrial Scanning e Machine Vision Armando Lopez spiega tutto quello che c'è da sapere.

Un'immersione più approfondita nell'apprendimento profondo OCR

Dovete sapere tutto quello che c'è da sapere su questo nuovo strumento di lettura del testo basato sull'intelligenza artificiale, soprattutto perché vi dirà quello che dovete sapere su molte cose, come la qualità e lo stato dei vostri prodotti.

Jim Witherspoon ha suscitato un certo scalpore quando, in un recente post sul blog di Zebra, ha affermato che l'OCR ad apprendimento profondo è stato uno dei progressi più significativi degli ultimi tempi nella tecnologia della visione. La maggior parte delle persone non pensa che l'OCR sia "avanzato" in alcun modo, forma o forma, tranne forse per l'età. (Tuttavia, l'OCR ad apprendimento profondo supera test che metterebbero in crisi l'OCR tradizionale. Pertanto, gli strumenti OCR ad apprendimento profondo dovrebbero essere comuni nelle strutture di produzione, stoccaggio, spedizione e ricezione come lo sono gli smartphone nella società moderna.

Ovunque i prodotti e gli imballaggi debbano essere costantemente esaminati prima di essere autorizzati e smistati per il successivo spostamento, potrebbero beneficiare di strumenti OCR di apprendimento profondo addestrati per individuare anche le più piccole discrepanze nel testo inciso sui più piccoli chip, pillole e componenti. Vedete incongruenze nei dati delle etichette? Siete preoccupati che sulla confezione siano state stampate informazioni sbagliate? Gli strumenti OCR di apprendimento profondo vi diranno se la vostra intuizione è giusta, e lo faranno in una frazione di secondo.

Proprio così: contrariamente a quanto si crede, è possibile insegnare a un vecchio cane nuovi trucchi - e questo vecchio cane (OCR) può imparare molti nuovi trucchi, e in fretta, grazie a modelli di intelligenza artificiale ad apprendimento profondo. Stiamo parlando di pochi minuti.

Quindi, continuate a leggere con mente aperta perché l'OCR ad apprendimento profondo NON è l'OCR tradizionale a cui state pensando in questo momento, e non creerà gli stessi problemi che hanno dato all'OCR tradizionale una cattiva reputazione nel corso degli anni. Anzi, risolve molti, se non tutti, i principali problemi che probabilmente avete incontrato con le tecniche OCR tradizionali. Ad esempio, il deep learning OCR.

_NON richiede molto tempo per l'addestramento. Esistono ora modelli pre-addestrati che possono essere messi in funzione in 5-10 minuti. Basta "spacchettare" la rete neurale, darle alcune indicazioni e si metterà al lavoro.
_Rimane stabile anche quando cambiano le impostazioni ambientali, come l'illuminazione.
_Gestisce casi d'uso complessi come un professionista, in parte perché la rete neurale è stata addestrata per scenari industriali, di camera bianca e di supply chain in cui "complesso" è normale. (Abbiamo visto la rete neurale Aurora Deep Learning OCR™ raggiungere un'accuratezza del 97% subito dopo l'installazione, anche quando si tratta di casi molto difficili).
_Elimina la necessità di avere a libro paga "esperti" di IA o di visione artificiale. Per mostrare all'algoritmo preaddestrato dell'intelligenza artificiale come lavorare nel vostro ambiente specifico è sufficiente disegnare un riquadro intorno ai caratteri da ispezionare e lasciare che lo strumento faccia il resto. Il team deve solo impostare l'altezza dei caratteri, il punteggio minimo di confidenza e la stringa di corrispondenza per avere tutto pronto e funzionante. Se è necessario apportare una modifica, le ispezioni possono essere regolate rapidamente al volo per tenere conto di nuovi metodi di stampa o di cambiamenti di carattere.
_Funziona su qualsiasi telecamera intelligente o piattaforma basata su PC. Può essere distribuito su tanti dispositivi diversi con tanti sistemi operativi diversi, come Windows, Linux o Linux ARM, desktop embedded e dispositivi compatti (come Raspberry Pi o Nvidia Jetson), dispositivi palmari Android e, naturalmente, telecamere intelligenti. Può funzionare su GPU o CPU. E si può avere "il pieno controllo dello sviluppo e dell'integrazione con altre applicazioni in C++ o .NET utilizzando l'Aurora Vision Library di Zebra", come ha ricordato al mondo il mio amico Donato Montanari in molte occasioni.

Pensate a questo aspetto: il deep learning OCR (almeno il modello offerto da Zebra) è simile al cervello di un ingegnere che è già stato addestrato su centinaia di migliaia di immagini e ha imparato ad adattarsi a diversi scenari. Quel cervello è pronto per essere messo al lavoro e per avere un impatto immediato dopo un debriefing di 5-10 minuti. L'OCR convenzionale, invece, è come chiedere a un bambino di cinque anni di decifrare ciò che ha davanti e di individuare "cosa c'è di sbagliato in questa immagine/frase" con perfezione anche se sta appena imparando a leggere. Il bambino può essere in grado di capire le poche lettere e identificare il tipo/colore dei caratteri che ha visto, ma questo è tutto.

Ecco perché è difficile trovare difetti nelle tecniche OCR di apprendimento profondo. Sono così brave a trovare difetti nel testo dei prodotti e delle etichette che escono dalla linea, e non solo perché il metodo di ispezione alternativo è uno strumento OCR più rudimentale/convenzionale.

Con il deep learning OCR, non importa se i caratteri che chiedete all'intelligenza artificiale di leggere sono oscurati, danneggiati, incisi, in rilievo, personalizzati per la vostra azienda, riflettenti, su una superficie curva o se appaiono diversi dal set di addestramento originale a causa di variazioni di illuminazione. Vi dirà se qualcosa è presente o assente, se è giusto o sbagliato, se è pronto per il cliente o se deve essere prelevato dall'inventario. E lo farà in pochi millisecondi!

Ora, potreste chiedervi quando e come dovreste utilizzare l'OCR ad apprendimento profondo, quando è il metodo di ispezione giusto e se dovreste abbandonare i vostri sistemi OCR convenzionali e sostituirli con l'OCR ad apprendimento profondo.

Spesso l'OCR deep learning viene utilizzato in ambienti operativi e flussi di lavoro simili, ma per scopi leggermente diversi. Ad esempio, l'OCR ad apprendimento profondo è in grado di gestire con facilità le seguenti "sfide":
_Lettura di contrassegni di identificazione, conformità, sicurezza e di altro tipo sui pneumatici dei veicoli.
_Analisi delle etichette e dei tappi delle provette
_Ispezione delle etichette delle confezioni di sangue
_Analisi dei documenti delle lettere di vettura

Naturalmente, l'ispezione di fine linea, la tracciabilità dei pezzi e la presenza/assenza sono i flussi di lavoro principali in cui l'OCR ad apprendimento profondo può fornire un valore, poiché in questo caso è importante "fare le cose per bene".

Onestamente, questo è il modo migliore per riassumere quando/dove/come si dovrebbe usare l'OCR deep learning: se dovete leggere date di scadenza, numeri di serie, numeri di lotto, numeri di identificazione dei veicoli (VIN) o simbologie di etichette, il deep learning OCR vi dirà quello che dovete sapere, ovvero se i componenti e le parti corrette si trovano nel posto giusto in quel momento, in base a requisiti di sicurezza, conformità e clienti definiti.

Ancora indecisi sull'OCR ad apprendimento profondo?

Potreste avere dei dubbi sull'IA e sulla visione artificiale, dato che molti leader aziendali stanno ancora cercando di risolvere la questione. (Secondo uno studio pubblicato di recente, solo il 40% dei fornitori di auto di primo livello, il 35% dei fornitori di auto di secondo livello e il 49% degli OEM del settore automobilistico in Germania hanno adottato la visione artificiale dell'IA). Tuttavia, è giusto sottolineare alcuni aspetti che potrebbero aiutarvi a convincere qualcuno o persino voi stessi che l'OCR con apprendimento profondo è l'investimento giusto e una mossa a basso rischio da fare in questo momento:
_Nessuno acquista sistemi di visione artificiale/telecamere intelligenti perché sono belli. Lo fanno perché sono super utili. Lo stesso vale per gli strumenti OCR di apprendimento profondo.
_Il parlato è facile. È un processo di apprendimento naturale. Tuttavia, la lettura è difficile per gli esseri umani. Ci vogliono anni e molti sforzi per imparare a leggere! Inoltre, è un'invenzione culturale moderna. Quindi, potreste in realtà offrire un sollievo ai vostri lavoratori togliendo la "lettura" dai loro elenchi di cose da fare, soprattutto se si considera quanto la lettura tende a essere noiosa nel processo di ispezione di pacchetti/prodotti/parti. Inoltre, avete mai provato a decifrare la calligrafia di qualcun altro? Sì, non è una cosa che aumenta la fiducia in se stessi. Riservatelo ai giochi di società, non alla banchina di carico o alle linee di produzione/imballaggio.
_La visione artificiale cerca di imitare l'uomo, è un'astrazione dell'uomo. È una telecamera che cerca di leggere come un essere umano. Sappiamo quanto sia difficile per gli esseri umani leggere, e l'OCR è essenzialmente una fotocamera che cerca di leggere da un'immagine. Senza l'aiuto di algoritmi/processi di deep learning, l'OCR rimarrà per sempre a un livello di lettura elementare. Ecco perché il deep learning OCR è così diverso (e molto più valido) dell'OCR tradizionale.  
_L'OCR tradizionale, che si può insegnare, funziona bene se si sta cercando di leggere un'immagine standard di base e se il testo che legge è quello che ci si aspetta che legga. Se tutto è coerente e perfetto. Il problema è che non viviamo in un mondo perfetto! Pertanto, l'OCR tradizionale farà fatica a essere "perfetto" quando dovrà leggere qualcosa che ha un aspetto diverso da quello che ha imparato a leggere. Se qualcosa è inaspettato, si blocca.

Se volete far funzionare l'OCR convenzionale, potete assolutamente insegnargli ciò che deve sapere e creare una libreria ricchissima di font, varianti e così via, se ne avete le capacità e il tempo. Ma cosa succede se l'elemento successivo ha uno sfondo diverso? Quante volte dovrete insegnare di nuovo all'OCR convenzionale ciò che l'OCR ad apprendimento profondo ha già imparato a fare? L'OCR ad apprendimento profondo funziona su immagini a colori, è in grado di leggere quasi tutti i testi in qualsiasi condizione (compresa la scrittura a mano) e può essere online in pochi minuti, addestrato sul proprio modello CNN AI, se lo si desidera. Non è nemmeno necessario addestrare font o gestire librerie per l'OCR ad apprendimento profondo.

Quindi, anche se la vostra configurazione OCR convenzionale non è obsoleta, dovete capire quando è la scelta giusta e quando l'OCR ad apprendimento profondo è la scelta migliore.

In una frase è possibile dire che "l'OCR convenzionale va usato quando si vuole che la telecamera legga l'ABC e si vuole essere certi che la telecamera legga l'ABC, quando il testo deve essere coerente".

In sintesi

Molti strumenti OCR richiedono di investire molto tempo per qualcosa che funziona in condizioni perfette, ma che troppo spesso fatica a funzionare perfettamente. L'eccezione è rappresentata dal deep learning OCR. Offre un'esperienza flessibile per voi, per i vostri ingegneri di imaging industriale e francamente per chiunque sia stanco di letture errate o mancate e voglia risolvere i problemi.

Inoltre, non vorreste che un adulto (piuttosto che un bambino) controllasse ciò che state immettendo sul mercato? E non sarebbe meglio se quell'adulto avesse poteri sovrumani e potesse lavorare a velocità di curvatura?

Quindi, smettete di pensare che l'OCR ad apprendimento profondo non sia adatto a voi, perché siete esattamente coloro che l'OCR ad apprendimento profondo è stato addestrato per aiutare. Approfittate dei nuovi trucchi di questo vecchio cane perché questi trucchi impediranno al cervello umano di giocarvi brutti scherzi e di costarvi un sacco di dolore e di soldi.

Share this
Accedi

Recupera password dimenticata
Non possiedi i dati di accesso? Registrati

Chiudi
Accedi

Recupera password dimenticata
Non possiedi i dati di accesso? Registrati

Chiudi

Richiesta prezzo speciale
per progetto

» Leggi l'informativa sulla privacy Invia richiesta
Chiudi