eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plNieruchomościGrupypl.misc.budowanie › Jak przechować dokumenty
Ilość wypowiedzi w tym wątku: 76

  • 71. Data: 2018-09-25 19:46:18
    Temat: Re: Jak przechować dokumenty
    Od: Jarosław Sokołowski <j...@l...waw.pl>

    Pan Mateusz Viste napisał:

    >> To coś zaszalałeś z jakością JPG.
    >> Daję 50% i nie widzę różnicy w jakości.
    >
    > To "50%" chyba różnie jest interpretowane w różnych programach. Niemniej
    > wykonałem test. Dokument źródłowy to strona z katalogu handlowego:
    >
    > JPG z jakością "50": 140 KiB
    > 4 bitowe PNG: 84 KiB
    >
    > Przy tej jakości wersja JPG jest co prawda czytelna ale tekst wygląda
    > paskudnie - literki jakby ktoś po nich brudnym paluchem mazał. A mimo
    > tego JPG jest niemal 2x cięższy od (4-bit) PNG. Ok, zdjęcia lepiej
    > wychodzą na JPG, ale w kontekście archiwizacji dokumentów interesuje mnie
    > wyłącznie tekst, a ten znacząco lepiej wychodzi przy PNG, przy mniejszym
    > rozmiarze.
    >
    > https://imgpile.com/images/njH0hP.jpg
    > https://imgpile.com/images/njHWz1.png

    No bo JPEG jest kompresją strtną, w której traci się akurat te informacje,
    jakie są bardzo ważne w obrazie zapisanej kartki papieru, a w przypadku
    fotografii z typowym landszaftem są nieistotne.

    Żeby nie być w tyle w tych wyścigach, wróciłem do swojego pliku ze
    skanem z poprzedniego przykładu (PNG 188798 bajtów). Pełną paletę
    kolorów zamieniłem na indeksowaną. Przy palecie 256 kolorów plik PNG
    ma 66044 bajty, a przy 16 kolorach -- 34245 bajty. Różnice wizualne
    są ledwie dostrzegalne, a różnica w czytelności zerowa (to ostatnie
    ma pełne uzasadnienie w fizjilogii widzenia).

    Jarek

    --
    Na wysokiej cyrli cosik się tam cyrni,
    Cy to kupa gnoja, cy dziewczyna moja?


  • 72. Data: 2018-09-25 20:20:50
    Temat: Re: Jak przechować dokumenty
    Od: Mateusz Viste <m...@n...pamietam>

    On Tue, 25 Sep 2018 19:46:18 +0200, Jarosław Sokołowski wrote:
    > No bo JPEG jest kompresją strtną,

    I dlatego nie należy jej stosować pisząc na usenecie. Wcina litrki.

    > w której traci się akurat te informacje,
    > jakie są bardzo ważne w obrazie zapisanej kartki papieru, a w przypadku
    > fotografii z typowym landszaftem są nieistotne.

    Sądzę że to jest dla wszystkich wypowiadającym się w tym wątku oczywiste.
    Odpowiadałem jednak na teorię przedpiścy, jakoby kompresja ta była
    niezauważalna ("nie widzę różnicy").

    > Żeby nie być w tyle w tych wyścigach, wróciłem do swojego pliku ze
    > skanem z poprzedniego przykładu (PNG 188798 bajtów). Pełną paletę
    > kolorów zamieniłem na indeksowaną. Przy palecie 256 kolorów plik PNG ma
    > 66044 bajty, a przy 16 kolorach -- 34245 bajty. Różnice wizualne są
    > ledwie dostrzegalne, a różnica w czytelności zerowa (to ostatnie ma
    > pełne uzasadnienie w fizjilogii widzenia).

    Ha, skusił się jednak na te 4 bit. To jednak pięciokrotne zmniejszenie
    pliku, przy zachowaniu pełnej jego czytelności. Z tym że ja i tak wolę
    kolory odrzucić, bo przy 4 bpp kolorowe dokumenty wyglądają czasem nieco
    komicznie, a przy 16 tonach w pełni zachowują swój pierwotny, poważny...
    ton.

    Mateusz


  • 73. Data: 2018-09-25 22:13:30
    Temat: Re: Jak przechować dokumenty
    Od: Jarosław Sokołowski <j...@l...waw.pl>

    Pan Mateusz Viste napisał:

    >> No bo JPEG jest kompresją strtną,
    > I dlatego nie należy jej stosować pisząc na usenecie. Wcina litrki.

    Kompresja stratna redundantnych kanałów informacji to jest jeszcze inny
    przypadek. Nie wcina informacji przekazywanej.

    >> w której traci się akurat te informacje, jakie są bardzo ważne
    >> w obrazie zapisanej kartki papieru, a w przypadku fotografii
    >> z typowym landszaftem są nieistotne.
    >
    > Sądzę że to jest dla wszystkich wypowiadającym się w tym wątku
    > oczywiste. Odpowiadałem jednak na teorię przedpiścy, jakoby
    > kompresja ta była niezauważalna ("nie widzę różnicy").

    Mam wrażenie, że do publicznej świadomości prawda ta dociera słabo.
    Uważa się powszechie, że JPEG, to taki format, który oszczędza dużo
    bajtów, a informacji zżera mało. Tymczasem ogrom strat widać na dwóch
    przeciwstawnych biegunach. Jak trzeba przedstawić ostre szczegóły
    (literki na przykład), albo gdy mamy pozornie jednolity kolor, który
    jednak minimalnie zmienia się z jakimś gradientem. Błękit nieba
    potrafi być paskudnie posiekany w plikach JPG.

    >> Żeby nie być w tyle w tych wyścigach, wróciłem do swojego pliku ze
    >> skanem z poprzedniego przykładu (PNG 188798 bajtów). Pełną paletę
    >> kolorów zamieniłem na indeksowaną. Przy palecie 256 kolorów plik
    >> PNG ma 66044 bajty, a przy 16 kolorach -- 34245 bajty. Różnice
    >> wizualne są ledwie dostrzegalne, a różnica w czytelności zerowa
    >> (to ostatnie ma pełne uzasadnienie w fizjilogii widzenia).
    >
    > Ha, skusił się jednak na te 4 bit. To jednak pięciokrotne zmniejszenie
    > pliku, przy zachowaniu pełnej jego czytelności. Z tym że ja i tak wolę
    > kolory odrzucić, bo przy 4 bpp kolorowe dokumenty wyglądają czasem nieco
    > komicznie, a przy 16 tonach w pełni zachowują swój pierwotny, poważny...
    > ton.

    Indeksowanie na podstawie histogramu, to jednak zupełnie co innego niż
    ślepe podzielenie całej gradacji na 4 albo 16 równomiernie temperowanych
    półcieni. Zrobiłem teraz coś, czeego bym sam bez inspiracji z zewnątrz
    nigdy nie zrobił. Zaindeksowałem plik na czterech poziomach *kolorów*
    (czyli dwa bity na piksel). Granatowy wcześniej podpis stał się teraz
    czarny, ale urzędowe pieczęcie barwę nadal mają czerwoną. Gdybym nie
    wiedział, jaki kolor ma tusz w długopisie Starszy Specjalista, to bym
    się nie poznał. Ogólnie jest nieźle -- tylko 18865 bajtów, co stanowi
    niemal dokładnie 10% z pierwotnych 188798 bajtów. To jest bardzo budujące
    spostrzęznienie (co dodam, by znowu się do nas jakiś nie czepiał, że
    ględzimy nie w tematyce grupy).

    Jarek

    --
    Więc chodź, pomaluj mój świat
    na żółto i na niebiesko,
    Niech na niebie stanie tęcza
    malowana twoją kredką.


  • 74. Data: 2018-09-25 22:52:24
    Temat: Re: Jak przechować dokumenty
    Od: Roman Tyczka <n...@b...no>

    On Tue, 25 Sep 2018 22:13:30 +0200, Jarosław Sokołowski wrote:

    > To jest bardzo budujące
    > spostrzęznienie (co dodam, by znowu się do nas jakiś nie czepiał, że
    > ględzimy nie w tematyce grupy).

    Jak nie w tematyce? Przecież mowa o budowaniu archiwum dokumentów ;-)

    Temat i odnoga wątku bardzo ciekawe, nie zamykajcie klawiatur :-)

    --
    pozdrawiam
    Roman Tyczka


  • 75. Data: 2018-09-26 08:40:20
    Temat: Re: Jak przechować dokumenty
    Od: Mateusz Viste <m...@n...pamietam>

    On Tue, 25 Sep 2018 22:13:30 +0200, Jarosław Sokołowski wrote:
    > Indeksowanie na podstawie histogramu, to jednak zupełnie co innego niż
    > ślepe podzielenie całej gradacji na 4 albo 16 równomiernie temperowanych
    > półcieni.

    Ja korzystam ze stałych palet 4- albo 16- tonowych. Wbrew intuicji, takie
    podejście zapewnia (u mnie) lepsze wyniki niż pozwolenie mądremu
    algorytmowi na dobranie samemu tonowej palety. W przypadku niektórych
    dokumentów taki algorytm próbuje czasem na siłę zachować jakiś wąski
    gradient, jeśli ten gradient występuje na względnie dużej powierzchni
    dokumentu. Krawędzie liter mogą stać się wtedy wizualnie lekko
    "postrzępione", tylko dlatego że algorytm chciał ładnie przedstawić
    jakieś dwa obrazki czy loga z dokumentu. A mi zależy najbardziej na
    ładnym tekście, nawet jeśli tekstu jest mniej jak grafiki. Dlatego
    forsuję swoje (równomiernie rozłożone) palety.

    > Zrobiłem teraz coś, czeego bym sam bez inspiracji z zewnątrz
    > nigdy nie zrobił. Zaindeksowałem plik na czterech poziomach *kolorów*
    > (czyli dwa bity na piksel). Granatowy wcześniej podpis stał się teraz
    > czarny, ale urzędowe pieczęcie barwę nadal mają czerwoną. Gdybym nie
    > wiedział, jaki kolor ma tusz w długopisie Starszy Specjalista, to bym
    > się nie poznał.

    Kiedy kilka(naście) lat temu testowałem różne kombinacje indeksowanie
    kolorów, tonów i półcieni, moja pierwsza myśl to było właśnie budowanie
    specyficznych kolorowych palet per dokument (wtedy to w ogóle bardzo
    modne było - jedna paleta dla "web", inna dla worda, inna do zdjęcia z
    wakacji, itd). Ta droga wydawała mi się wtedy najbardziej skuteczna,
    mądra i w ogóle nowoczesna. Ale tu znów mądre algorytmy okazały się
    przeszkodą dla czytelności tekstu. Przykład: zdarzało się że poszczególne
    piksele na krawędziach liter nabierały lekkich kolorów (np. wokół
    czarnego tekstu pojawiały się piksele ciemno-czerwone albo błękitne). A
    to dlatego, że program nie miał już miejsca na zachowanie w palecie
    takiej odcieni szarości która byłaby bliska oryginalnemu pikselowi, i
    uznał że taki błękitny lepiej oddaje jasność oryginału niż np. ciemno-
    szary.

    Słowem - czasem kolorowe palety na podstawie histogramu wychodzą dobrze,
    ale jednak często są wpadki. A ja lubię determinizm i gładką czcionkę, i
    to udaje mi się otrzymać wyłącznie za pomocą równomiernie rozłożonych
    palet tonowych (2- lub 4- bitowych, zależnie od złożoności materiału
    początkowego). No i nie chcę też tracić czasu na analizę każdego
    skanowanego dokumentu. Mam od lat jedną, uniwersalną procedurę i wiem że
    jak zrobię skan to będzie wyglądał tak, jak tego oczekuję, i co najwyżej
    mogę rzutem oka wybrać jeden z dwóch wariantów (2 bpp lub 4 bpp) do
    zachowania.

    Mateusz


  • 76. Data: 2018-09-26 11:33:02
    Temat: Re: Jak przechować dokumenty
    Od: Jarosław Sokołowski <j...@l...waw.pl>

    Pan Mateusz Viste napisał:

    >> Indeksowanie na podstawie histogramu, to jednak zupełnie co innego niż
    >> ślepe podzielenie całej gradacji na 4 albo 16 równomiernie temperowanych
    >> półcieni.
    >
    > Ja korzystam ze stałych palet 4- albo 16- tonowych. Wbrew intuicji,
    > takie podejście zapewnia (u mnie) lepsze wyniki niż pozwolenie mądremu
    > algorytmowi na dobranie samemu tonowej palety.

    Przyznam, że szesnastotonowa paleta ma swoje ograniczenia. Efekt będzie
    dobry, gdy jakość oryginału jest odpowiednia. Biała kartka z napisami,
    a nie jakiś stary poplamiony papier z niewyraźnym drukiem.

    > Słowem - czasem kolorowe palety na podstawie histogramu wychodzą dobrze,
    > ale jednak często są wpadki. A ja lubię determinizm i gładką czcionkę

    Ja kierowany tymi samymi przesłankami całkiem odpuściłem sobie ładowanie
    szesnastotonowych palet. Dla uniknięcia wpadek na składowisko jadę zawsze
    z pełnym kolorem. Ale gdyby zaszła potrzeba, mogę nawet po kilku latach
    coś skompresować.

    Jarek

    --
    You load sixteen tons, what do you get
    Another day older and deeper in debt
    Saint Peter don't you call me 'cause I can't go
    I owe my soul to the company store

strony : 1 ... 7 . [ 8 ]


Szukaj w grupach

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1