Condense - szybkie OCR dla Mac
Zdarza mi się co jakiś czas, że interesujący mnie fragment tekstu muszę przepisać ręcznie, gdyż znajduje się on na obrazku. Czasami jest to zdjęcie, innym razem skan jakiegoś większego tekstu, czasem książek z mojej biblioteki, które systematycznie "skanuję" za pomocą Scanbota dla iOS. Przepisywanie tekstu jest i pracochłonne i niezbyt wygodne. Rozwiązaniem problemu szybkiego rozpoznawania tekstu ze zdjęć jest program dla Mac o nazwie Condense.
Condense działa w bardzo prosty sposób, wykonuje zrzut ekranu i rozpoznaje znajdujący się na nim tekst. Po stuknięciu w przycisk skanowania w oknie programu, lub wciśnięciu skrótu klawiszowego, zaznaczamy wybrany obszar ekranu, którego zrzut zostanie wykonany. Program następnie dokonuje rozpoznania znajdującego się na nim tekstu. Mamy możliwość wybrania odpowiedniego kontrastu "skanowania" w zależności od tego czy litery znajdują się na jednolitym, białym, kolorowym czy niejednolitym tle. Możemy także zmienić kąt obrazka, jeśli tekst nie układa się poziomo.
Domyślnie program zastępuje także przełamania tekstu spacjami, nie dotyczy to jednak dzielenia wyrazów. Tutaj litery rozpoznawane są zwykle poprawnie, jednak sam wyraz nie jest łączony, a jego części zapisywane są osobno z myślnikiem. Cały tekst wyświetlany jest najpierw w oknie podglądu, gdzie możemy dokonać zarówno korekty korzystając z proponowanych przez program słów, lub wpisując je ręcznie.
W oknie podglądu możemy także wybrać funkcję odczytania tekstu przez wbudowany w OS X syntetyzer mowy. Mi osobiście zdecydowanie lepiej dokonuje się ręcznej korekty już po zapisaniu zeskanowanego tekstu, w głównym oknie Condense.
Jeśli chodzi o jakość rozpoznawania, ta zależy w dużej mierze od jakości samego obrazka. Zeskanowane przeze mnie fragmenty Historii Stanów Zjednoczonych do obrazków o niezbyt dobrej jakości (np. wyginający się tekst - efekt zagiętych do środka kart tego opasłego tomu) zostały w większości rozpoznane poprawnie. Najczęstszymi błędami to zastępowanie dwóch liter "i" tzw. umlautem czy znaków "rn" literą "m".
Aktualizacja: twórca programu Thomas Johannesmeyer informuje, że zastępowanie dwóch liter "i" znakiem "ü" to błąd, który zostanie usunięty wraz z następną aktualizacją programu.
Lista języków wspieranych przez Condense jest naprawdę długa. Jest też na niej język polski.
Condense nie jest rozbudowanym narzędziem do obróbki jakichś długich i obszernych dzieł. Świetnie się jednak spisuje wtedy, kiedy potrzeba na szybko rozpoznać jakiś tekst, który w innej sytuacji musielibyśmy przepisać. Wspomnę na koniec, że program oferuje także archiwum. Zawsze możemy wrócić do rozpoznanego wcześniej tekstu.
Condense dla Mac w Mac App Store w cenie 4,99 €:
Condense - Pobierz z Mac App Store