eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plNieruchomościGrupypl.misc.budowanieJak przechować dokumenty › Re: Jak przechować dokumenty
  • Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed2.atman.pl!newsfeed.atman.pl!go
    blin1!goblin.stu.neva.ru!proxad.net!feeder1-2.proxad.net!cleanfeed1-a.proxad.ne
    t!nnrp1-1.free.fr!not-for-mail
    From: Mateusz Viste <m...@n...pamietam>
    Subject: Re: Jak przechować dokumenty
    Newsgroups: pl.misc.budowanie
    References: <0...@g...com>
    <s...@f...lasek.waw.pl>
    <5ba233be$0$14293$426a74cc@news.free.fr>
    <s...@f...lasek.waw.pl>
    <5ba26260$0$5481$426a74cc@news.free.fr>
    <s...@f...lasek.waw.pl>
    <1...@4...com>
    <s...@f...lasek.waw.pl>
    <1...@4...com>
    <5baa64f3$0$15094$426a34cc@news.free.fr>
    <s...@f...lasek.waw.pl>
    <5baa7c82$0$21591$426a34cc@news.free.fr>
    <s...@f...lasek.waw.pl>
    User-Agent: Pan/0.139 (Sexual Chocolate; GIT bf56508 git://git.gnome.org/pan2)
    MIME-Version: 1.0
    Content-Type: text/plain; charset=UTF-8
    Content-Transfer-Encoding: 8bit
    Date: 26 Sep 2018 06:40:20 GMT
    Lines: 48
    Message-ID: <5bab29d4$0$21614$426a74cc@news.free.fr>
    Organization: Guest of ProXad - France
    NNTP-Posting-Date: 26 Sep 2018 08:40:20 CEST
    NNTP-Posting-Host: 82.64.0.151
    X-Trace: 1537944020 news-1.free.fr 21614 82.64.0.151:44082
    X-Complaints-To: a...@p...net
    Xref: news-archive.icm.edu.pl pl.misc.budowanie:545486
    [ ukryj nagłówki ]

    On Tue, 25 Sep 2018 22:13:30 +0200, Jarosław Sokołowski wrote:
    > Indeksowanie na podstawie histogramu, to jednak zupełnie co innego niż
    > ślepe podzielenie całej gradacji na 4 albo 16 równomiernie temperowanych
    > półcieni.

    Ja korzystam ze stałych palet 4- albo 16- tonowych. Wbrew intuicji, takie
    podejście zapewnia (u mnie) lepsze wyniki niż pozwolenie mądremu
    algorytmowi na dobranie samemu tonowej palety. W przypadku niektórych
    dokumentów taki algorytm próbuje czasem na siłę zachować jakiś wąski
    gradient, jeśli ten gradient występuje na względnie dużej powierzchni
    dokumentu. Krawędzie liter mogą stać się wtedy wizualnie lekko
    "postrzępione", tylko dlatego że algorytm chciał ładnie przedstawić
    jakieś dwa obrazki czy loga z dokumentu. A mi zależy najbardziej na
    ładnym tekście, nawet jeśli tekstu jest mniej jak grafiki. Dlatego
    forsuję swoje (równomiernie rozłożone) palety.

    > Zrobiłem teraz coś, czeego bym sam bez inspiracji z zewnątrz
    > nigdy nie zrobił. Zaindeksowałem plik na czterech poziomach *kolorów*
    > (czyli dwa bity na piksel). Granatowy wcześniej podpis stał się teraz
    > czarny, ale urzędowe pieczęcie barwę nadal mają czerwoną. Gdybym nie
    > wiedział, jaki kolor ma tusz w długopisie Starszy Specjalista, to bym
    > się nie poznał.

    Kiedy kilka(naście) lat temu testowałem różne kombinacje indeksowanie
    kolorów, tonów i półcieni, moja pierwsza myśl to było właśnie budowanie
    specyficznych kolorowych palet per dokument (wtedy to w ogóle bardzo
    modne było - jedna paleta dla "web", inna dla worda, inna do zdjęcia z
    wakacji, itd). Ta droga wydawała mi się wtedy najbardziej skuteczna,
    mądra i w ogóle nowoczesna. Ale tu znów mądre algorytmy okazały się
    przeszkodą dla czytelności tekstu. Przykład: zdarzało się że poszczególne
    piksele na krawędziach liter nabierały lekkich kolorów (np. wokół
    czarnego tekstu pojawiały się piksele ciemno-czerwone albo błękitne). A
    to dlatego, że program nie miał już miejsca na zachowanie w palecie
    takiej odcieni szarości która byłaby bliska oryginalnemu pikselowi, i
    uznał że taki błękitny lepiej oddaje jasność oryginału niż np. ciemno-
    szary.

    Słowem - czasem kolorowe palety na podstawie histogramu wychodzą dobrze,
    ale jednak często są wpadki. A ja lubię determinizm i gładką czcionkę, i
    to udaje mi się otrzymać wyłącznie za pomocą równomiernie rozłożonych
    palet tonowych (2- lub 4- bitowych, zależnie od złożoności materiału
    początkowego). No i nie chcę też tracić czasu na analizę każdego
    skanowanego dokumentu. Mam od lat jedną, uniwersalną procedurę i wiem że
    jak zrobię skan to będzie wyglądał tak, jak tego oczekuję, i co najwyżej
    mogę rzutem oka wybrać jeden z dwóch wariantów (2 bpp lub 4 bpp) do
    zachowania.

    Mateusz

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1