25. 1. 2016

PDF OCR

Máme PDF soubor, který obsahuje naskenované stánky anglické knihy, a potřebujeme jej převést na holý text. Pokud možno na Linuxu a z příkazové řádky. Pojďme na to.

Nejdříve soubor PDF rozbijeme na jednotlivé stránky: Jedna stránka — jeden bitmapový soubor:

pdftoppm input.pdf page

Získáme spoustu souborů page-001.ppm, page-002.ppm, atd.

K převodu obrázků na text použijeme program tesseract. Připravíme si makefile, který nám zajistí převod všech souborů:

SRC := $(wildcard *.ppm)
DST := $(patsubst %.ppm,%.txt,$(SRC))

all: $(DST)

%.txt: %.ppm
 tesseract $< $(basename $@)

Vlastní převod spustíme jednoduše pomocí make. Vytvoří se nám soubory page-001.txt, page-002.txt, atd. Tyto sloučíme do jediného výstupního textového souboru takto:

cat page-???.txt >output.txt

A máme hotovo.

9. 1. 2016

Projektivní

Rorschachu,
jakožto
tvoje žena
jsem tvými
skvrnami
znechucena.

Po celém
domě už
rudá vzteky
nacházím
všude ty
tvoje fleky.

Skvrna jak
žena od
pasu dolů,
další jak
dvě láhve
alkoholu.

Nepáchej
doma furt
tolik škody,
zajdi si
raději
do přírody.

Venku se
zbavíš své
posedlosti,
nebudeš
furt myslet
na blbosti.

7. 1. 2016

Politická

Naše péče o přírodu
globálně je pojata.
My přírodu zachráníme,
rostliny i zvířata.

Zajistíme do budoucna
přírodu bez úhony.
Naši snahu nezastaví
fyzikální zákony.

Lide zdejší, lide prostý,
příroda to ocení,
od teď nesmíš používat
energii k topení.

1. 1. 2016

Instalace Ubuntu Serveru na HP ProLiant MicroServer Gen8

HP Proliant MicroServer Gen8 je krásný maličký nízkospotřebový server. Není problém na něj nainstalovat Ubuntu Desktop, není problém na něj nainstalovat Ubuntu Server v případě, že se používá jediný disk. Naopak je značně obtížné na něj nainstalovat Ubuntu Server, pokud mají disky pracovat v režimu RAID.

Toto by měl zařídit zaváděč GRUB. Bohužel server odmítá zavést systém z disku, pokud na něm nenajde žádný oddíl jemu známého typu.

Další problém je způsoben tím, že při instalaci systému z USB flash disku je jiné pojmenování disků během instalace a jiné pak za běhu, kvůli čemuž dochází k dalším problémům při zavádění systému.

Následující postup je sice kostrbatý, ale aspoň vede k cíli.

  • Při instalaci systému ručně vytvoříme diskové oddíly. Vytvoříme RAID oddíly podle potřeby, ale kromě toho aspoň na jednom disku musí být oddíl typu ext4 s přípojným bodem /boot.
  • Systém nainstalujeme standardním způsobem.
  • Po rebootu se objeví výzva
    grub rescue>
  • Zadáme příkaz set a vypíše se mimo jiné
    PREFIX=(hd0,msdos1)/boot/grub
    První oddíl má přípojný bod /boot, takže se v něm už adresář boot nenachází a uvedená cesta je tedy špatně. Změníme ji příkazem
    set PREFIX=(hd0,msdos1)/grub
  • Když je cesta ke GRUBu správně, můžeme zavést modul pro další fázi GRUBu pomocí
    insmod normal
    a pustit pokračování pomocí
    normal
    Systém naběhne.
  • V běžícím systému vytvoříme novou a správnou konfiguraci GRUBu pomocí
    update-grub
  • Znovu nainstalujeme GRUB pomocí
    grub-install /dev/sda

Hotovo. Konečně.

Dvojková

V binárním světě
biolog,
archeolog i
geolog
dají si grog či
jiný mok
a popřejí si
nový rok
11111100000.