SE - Ikonky OCR #35

Closed
opened 2017-09-22 19:15:19 +02:00 by Podhorecky · 9 comments
Podhorecky commented 2017-09-22 19:15:19 +02:00 (Migrated from git.spotter.cz)

funkčnost OCR sice byla zadána v settingu, kód k tomu patrně není běžně k dispozici. Myslím, že se tim zabývali někde v Asii, ale neviděl jsem z toho vůbec nic.
Takže pokud to je zas další bábovička na pískovišti a hrad si musíme postavit sami, tak to momentálně odložme na neurčito a ty malé ikony na každé straně se můžou odstranit. (setting?)

funkčnost OCR sice byla zadána v settingu, kód k tomu patrně není běžně k dispozici. Myslím, že se tim zabývali někde v Asii, ale neviděl jsem z toho vůbec nic. Takže pokud to je zas další bábovička na pískovišti a hrad si musíme postavit sami, tak to momentálně odložme na neurčito a ty malé ikony na každé straně se můžou odstranit. (setting?)
Disassembler commented 2017-09-22 23:27:52 +02:00 (Migrated from git.spotter.cz)

Zkuste to OCR teď. Sice je hned na začátku jeho kódu velké tlusté varování

DEPRECATION WARNING

This class is being replaced by the S3RL_PDF codec

Initially the reporting features will be replaced, with the OCR
process being removed at a later stage.

nicméně jednoduchým doplněním jakési ladící hodnoty se mi jej podařilo donutit alespoň nabízet formuláře ke stažení a vyplnění. Otestování, zda je modul schopen číst i vyplněná data zatím nechám na Vás. Samozřejmě PDFka nepodporují diakritiku, protože řez písma se nebere z nastavení jako u exportů, ale je napevno nastaven asi na dvaceti místech. Navíc ještě do hry vstupuje i metrika fontu, takže není tak úplně jednoduché jej přepláncout jiným, ale v případě, že by o funkci stále byl zájem se o to mohu pokusit.

Zkuste to OCR teď. Sice je hned na začátku jeho kódu velké tlusté varování ``` DEPRECATION WARNING This class is being replaced by the S3RL_PDF codec Initially the reporting features will be replaced, with the OCR process being removed at a later stage. ``` nicméně jednoduchým doplněním jakési ladící hodnoty se mi jej podařilo donutit alespoň nabízet formuláře ke stažení a vyplnění. Otestování, zda je modul schopen číst i vyplněná data zatím nechám na Vás. Samozřejmě PDFka nepodporují diakritiku, protože řez písma se nebere z nastavení jako u exportů, ale je napevno nastaven asi na dvaceti místech. Navíc ještě do hry vstupuje i metrika fontu, takže není tak úplně jednoduché jej přepláncout jiným, ale v případě, že by o funkci stále byl zájem se o to mohu pokusit.
Podhorecky commented 2017-09-22 23:34:02 +02:00 (Migrated from git.spotter.cz)

aha.. zajímavé, díky.. PDF se vyrobilo. tak to určitě ještě zkuste s tím fontem, a pokud je něco, s čím by se dalo otravovat na Githubu, tak neváhejte
Může být i nějaký monospace font.

aha.. zajímavé, díky.. PDF se vyrobilo. tak to určitě ještě zkuste s tím fontem, a pokud je něco, s čím by se dalo otravovat na Githubu, tak neváhejte Může být i nějaký monospace font.
Podhorecky commented 2017-09-23 00:32:56 +02:00 (Migrated from git.spotter.cz)

ještě než se do toho pustíte, já se zkusím zorientovat co konkrétně mi to může nabídnout.

ještě než se do toho pustíte, já se zkusím zorientovat co konkrétně mi to může nabídnout.
Podhorecky commented 2017-09-23 01:11:32 +02:00 (Migrated from git.spotter.cz)

Modul Projects - Otevřít úlohy pro Projekt
https://dasm.dasm.cz:8443/eden/project/project

https://dasm.dasm.cz:8443/eden/project/project/create.pdf
`{"status": "failed", "message": "NOT IMPLEMENTED", "statuscode": "501"}

Modul Projects - Otevřít úlohy pro Projekt https://dasm.dasm.cz:8443/eden/project/project https://dasm.dasm.cz:8443/eden/project/project/create.pdf `{"status": "failed", "message": "NOT IMPLEMENTED", "statuscode": "501"}
Podhorecky commented 2017-09-23 01:15:01 +02:00 (Migrated from git.spotter.cz)

Modul Warehouses - Inventory
https://dasm.dasm.cz:8443/eden/inv/recv/create.pdf
{"status": "failed", "message": "INTERNAL SERVER ERROR", "statuscode": "500"}

takových situací na různých stranách tam bude asi víc, vypadá to že to je hodně opuštěné.

Modul Warehouses - Inventory https://dasm.dasm.cz:8443/eden/inv/recv/create.pdf {"status": "failed", "message": "INTERNAL SERVER ERROR", "statuscode": "500"} takových situací na různých stranách tam bude asi víc, vypadá to že to je hodně opuštěné.
Disassembler commented 2017-09-23 09:48:08 +02:00 (Migrated from git.spotter.cz)

Takže jaký je konečný verdikt? Opravit češtinu a nechat na programátora nebo vypnout?

Podpory shora se tu celkem určitě nedočkáme, maximálně nám řeknou, že jim můžeme pomoct to OCR přepsat. Mimoto koukám na ty PDF a zjišťuji, že jim vlastně moc nerozumím. Zdá se, že obsahují naprosto všechna pole, bez nějaké očividné struktury. Pokud by měl polní pracovník ke každé evidované osobě vyplnit 26stránkový formulář tak, jak jej generuje Sahana, u třetího člověka spáchá propiskou seppuku.

Takže jaký je konečný verdikt? Opravit češtinu a nechat na programátora nebo vypnout? Podpory shora se tu celkem určitě nedočkáme, maximálně nám řeknou, že jim můžeme pomoct to OCR přepsat. Mimoto koukám na ty PDF a zjišťuji, že jim vlastně moc nerozumím. Zdá se, že obsahují naprosto všechna pole, bez nějaké očividné struktury. Pokud by měl polní pracovník ke každé evidované osobě vyplnit 26stránkový formulář tak, jak jej generuje Sahana, u třetího člověka spáchá propiskou seppuku.
Podhorecky commented 2017-09-23 10:15:36 +02:00 (Migrated from git.spotter.cz)

Já na to taky pak včera koukal, a mám z toho podobný pocit. Je to takový levný pokus o OCR postup. Nevyzkoušel jsem vyplnění a import, protože nemám tiskárnu a skener doma. Pravděpodobně tedy OCR uložíme k ledu, ikonky vypnout a zůstane nám info v jakém to je stavu.
Díky za tuhle informaci... nikdo jiný by mi ji nezprostředkoval.

Já na to taky pak včera koukal, a mám z toho podobný pocit. Je to takový levný pokus o OCR postup. Nevyzkoušel jsem vyplnění a import, protože nemám tiskárnu a skener doma. Pravděpodobně tedy OCR uložíme k ledu, ikonky vypnout a zůstane nám info v jakém to je stavu. Díky za tuhle informaci... nikdo jiný by mi ji nezprostředkoval.
Disassembler commented 2017-09-23 10:45:19 +02:00 (Migrated from git.spotter.cz)

closed via commit 99e00e07d4

closed via commit 99e00e07d442555a1d94d431e8b1b5949cee2326
Podhorecky commented 2018-03-14 22:57:01 +01:00 (Migrated from git.spotter.cz)

changed milestone to %2

changed milestone to %2
Sign in to join this conversation.
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: Disassembler/Spotter-VM#35
No description provided.