ocr software

Forumsregeln
Regeln für den Offenen Bereich

Für alle Gäste gelten die üblichen Forenregeln.

Registrierte Benutzer sollen hier keine Threads eröffnen, sondern dafür die anderen Unterforen nutzen, dürfen aber Antworten erstellen.

Das Posten von

- Links jeder Art, mit Ausnahme GLF-internen Links,
- Bildern aller Art per img-Funktion, weil damit auch IPs der User ermittelt werden können,
- URLs im Text

ist nicht erlaubt.

Außerdem werden keine sachfremden Diskussionen über z.B. Esoterik, Wahnvorstellungen, Endzeitverkündungen... zugelassen. Für solche Sachen gibt es woanders genug Möglichkeiten der Diskussion. Wir werden besonders auf wiederkehrende Spammer achten.

Bitte antwortet auch nicht auf Massenspam mit Beschimpfungen und Drohungen. Nutzt für solche Beiträge den Meldebutton oder ignoriert sie.

Beiträge oder Threads, die gegen obige Regeln verstoßen, werden kommentarlos entfernt und die Antworten darauf ebenfalls.

Immer wieder finden es Gäste lustig, sich einen Namen zu geben, der obszön oder beleidigend sein soll. Wundert Euch nicht, wenn diese Threads oder Beiträge nicht freigeschaltet werden.

Antwort erstellen


Diese Frage dient dazu, das automatisierte Versenden von Formularen durch Spam-Bots zu verhindern.
Smileys
:D :) :( :o :shock: :? 8) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :idea: :arrow: :| :?: :mrgreen: :herz: :rotfl: :wegrenn: :kopfsch:

BBCode ist eingeschaltet
[img] ist eingeschaltet
[url] ist ausgeschaltet
Smileys sind eingeschaltet

Die letzten Beiträge des Themas
   

Ansicht erweitern Die letzten Beiträge des Themas: ocr software

Re: ocr software

von Gast » 27.08.2011, 17:03

ocr hat geschrieben:was empiehlt sich denn um alte, themenbezogene bücher einzuscannen?
wer hat das schon mal gemacht?
Ein Scanner und ein PC ist zu empfehlen. Das geht nicht nur mit alten, themenbezogenen Büchern. Die neueste Ausgabe des Playboy für Spieljungen lässt sich damit auch scannen und per Mail verteilen.

Re: otr software

von HerrDoppler » 09.08.2011, 15:53

TerraIncognita hat geschrieben:Themenbezogene noch .....
Alte themenrelevante Bücher gibts auch schon teilweise im Netz. ....
Es gibt eine US-internationale Website mit erotischen Texten, viele davon aus diesem Themenbereich, auch deutsche, die ich aber nicht beim Namen zu nennen wage, sonst wird es wegzensiert. Aber mein Deckname sollte ein guter Tipp sein.

Da sind auch jede Woche 5-10 gescannte und per OCR in Text verwandelte alte Bücher ('novels') dabei. Frag doch den Editor, wie er das macht. E-mail link ist auf der Homepage.

Re: ocr software

von ocr » 31.07.2011, 13:30

okay, meine wahl ist getroffen!
eindeutig omnipage (18).
danke perma für den tipp.

finereader ist gut, weil es (in der mir vorliegenden version) nicht installiert werden muss. es macht aber keine tests und wirkt nur halb so professionell wie omnipage.

ausschlaggebend war die erstaunlich gut funktionierende funktion einen scan DIREKT als audiodatei abzuspeichern!
Man liest effizienter, wenn man das gelesene gleichzeitig hört, auch wenn es etwas komisch klingt.

Beispiel hat geschrieben:7.
Pädophilie
Die Pädophilie ist eine sexuelle Deviation, bei der sich der Sexualtrieb Erwachsener ausschließlich auf präpubertäre Kinder richtet. In unserer Kultur gilt sie als Deviation, doch zu anderen Zeiten und an anderes Orten herrschten oder herrschen andere Sitten. So ist zum Beispiel in bestimmten ostindischen Provinzen die Heirat vor dem Pubertätsalter nach wie vor nichts Ungewöhnliches. In der Antike war der sexuelle Mißbrauch kleinerer Kinder durch Pädagogen, Erzieher und Lehrer an der Tagesordnung: PLUTARCH schrieb, frei geborene römische Knaben hätten in ihrer jüngsten Jugend Goldkugeln um den Hals getragen, nix damit Männer auch in einer Schar nackter Jungen mühelos jene ausmachen konnten, die für einen Mißbrauch zur Verfügung standen. Im Mittelalter verliebte sich DANTE in die neunjährige Beatrice, und der Renaissance-Dichter PETRARCA entflammte für seine Laura, als sie ein blondhaariges Nymphchen von zwölf Jahren war. Auch Julia war erst zwölf oder dreizehn, als sie sich ihrem Romeo hingab.
In unserem zwanzigsten Jahrhundert macht man sich viele Gedanke. über die Grenzen von Kindheit und Ende des Jugendalters; die Definitionen werden vom Rechtssystem festgelegt. Im englischen »Children and Young Persons Act« von 1933 wird ein »Mädchen-Kind« als »Mädchen, das über acht, aber unter vierzehn Jahre ist« bezeichnet. In Massachusens definiert man ein »mißratenes Kind« als ein Kind im Alter von sieben bis siebzehn, das gewohnheitsmäßigen Umgang mit »lasterhaften oder unmoralischen Personen« hat. Die Pädophilie beinhaltet alle Formen da Deviation, auch Fetischismus, Sadomasochismus, Exhibitionismus, Voyeurismus und Homosexualität.
Die pädophile Deviation hat zwei Hauptwurzeln. Die erste beruht auf der Abwehr des Pädophilen von Ängsten, die eine sexuell reife Frau in ihm auslöst. Er hat Angst vor genitaler Minderwertigkeit, fürchtet, einen zu kleinen Penis zu haben, um eine sexuell reife Frau befriedigen zu können. Beim Geschlechtsverkehr mit einem Kind fühlt sich der Pädophile überlegen, und seine Potenzangst nimmt ab. Die Angst kann aber auch von den weiblichen Genitalien und der Erwachsenensexualität im allgemeinen ausgelöst werden. In diesem Fall sieht der Pädophile die weiblichen
Regelverstoß editiert. GLF-Moderation
Der Text an sich ist schon sehr geil (1990) und das Ergebins gefällt mir auch (hört selbst... ggf. verschieben/hochladen bitte, danke).
Fraglich ist nur, ob ich das als reinen Text oder PDF speichern sollte...
Als Text liest es sich nicht so gut, als PDF sieht es noch nicht so gut aus.

Re: ocr software

von Terra » 28.07.2011, 07:45

Der Zweck war ganz am Anfang mal ein Hobby. Die Bücher waren thematisch über die Zeit auch recht verschieden gingen aber auch mehr oder weniger in eine große Richtung und die letzten hab ich eingescannt weil mich das Thema interessieren musste (und aucht tat). Auch sonst kann der Wissensvorsprung bzw wo man schnell irgendwelche Literatur herbekommt recht praktisch für einen Beruf oder Ausbildung sein oder auch einfach wenns der "Wahrheits"findung dient.

Re: ocr software

von ocr » 28.07.2011, 04:13

Hätte ich nicht geahnt, dass du abwiegelst, wäre ich wohl kaum interessiert!
Also über den Inhalt magst du nicht sprechen, vielleicht über den (beruflichen)Zweck?

Re: ocr software

von Terra » 27.07.2011, 18:12

Das Thema der Bücher?
Wäre zu viel des Guten. Nichts was mit dem P-Thema zu tun hätte.

Motivation: Wissen ist Macht. Ich fand freien Zugang zu Wissen schon immer eine tolle Sache. Ich hab mich über die Bücher anderer gefreut und sie sich denk ich auch über meine.
Bei manchen hab ich die aber auch erstmal nur aus Eigeninteresse eingescannt weil Dauerausleihe eben nicht möglich war/ist.

Re: ocr software

von ocr » 27.07.2011, 11:23

"Hab vor ein paar Jahren mal diverse Bücher eingescannt und dann hin und wieder mal eins. Insgesamt sind es bis jetzt so 3000-3500 Seiten gewesen. Das dickste hatte so 1300 Seiten"

Bin nu neugierig.
Das Thema der Bücher?
Woher kommt die Motivation?
Hast du deine Dissertation plagiatisiert? ;o)

Re: ocr software

von Terra » 27.07.2011, 07:53

Du scannst also viel (und schon lange)?
Hab vor ein paar Jahren mal diverse Bücher eingescannt und dann hin und wieder mal eins. Insgesamt sind es bis jetzt so 3000-3500 Seiten gewesen. Das dickste hatte so 1300 Seiten und da musste man schon etwas aufdrücken und dem Buch hat es sicher auch nicht gut getan. Es lebte aber noch als ich es zurückgab. Ein paar der Bücher sind auch im Netz gelandet die waren etwas besser bearbeitet allerdings ohne OCR. Irgendwo hab ich mal OCR mit Abby ausgetestet. Es tut zwar was es soll. Aber da die Sachen teilweise älter waren gabs trotzdem noch recht viele Fehler und mir war es zu doof das alles zu korrigieren. Da hab ich das mit dem OCR dann verworfen. Manches hab ich auch einfach nur eingescannt und dann ein pdf draus gemacht. Sieht nicht schön aus erfüllt aber seinen Zweck.
Hast du nen Bücherscanner?


Damals hatte ich nur nen normalen Flachbrettscanner. Der hat irgendwann ne Macke gekriegt und hat nur bis zur Hälfte gescannt bzw blieb ganz stecken. Ich schiebs immer aufs Aufdrücken, kann auch sonst normaler Verschleiß gewesen sein.

Re: ocr software

von ocr » 27.07.2011, 02:44

"Zur Not kann man sich ja mit einer Digitalkamera und einer entsprechenden (ggf. selbstkonstruierten) Halterung behelfen"

Stativ solves ;)
Ist vielleicht sogar ne gute idee. Wenn ide Auflösung reichen würde, würd ich ein Video machen und die Frames extrahieren. Fehlt nur mehr der Legoroboter, der die seiten blättert :)



"sehr auf den Scanner aufdrücken was dieser nicht unbedingt gern hat (Erfahrungswerte)"

Du scannst also viel (und schon lange)?
Hast du nen Bücherscanner?




"Wenn bei dir im Regal das Pädo Einmal Eins steht haben sie Blut geleckt und fühlen sich vielleicht genötigt noch etwas mehr zu suchen."

Bei entsprechendem Beschluss, wissen sie um was es geht. Ob sie Bücher finden oder nicht. Soll ja hier auch Pedos geben, die ihr Zimmer voller Kinderbilder und Logos haben ;o)


"Die es auch noch nicht online gibt?"
Öhm... weiß ich doch nicht. :)

Die Konkret von 1980 zum Thema oder "DNP" 5.2011 zum Thema Antiandrogenegibt es wohl nicht online!


"theoretisch muss man da überall nochmal drüberlesen was allerdings ziemlich viel Arbeit ist"
zum glück hab ich das meiste noch nicht gelesen ;o)

Re: otr software

von Terra » 26.07.2011, 07:22

Ich erwarte keine Bilder, sondern reinsten Text! Da sollte das Problem ja nicht mehr bestehen...
Hmm doch, wie gesagt hängt von der Dicke ab. Bei dicken Büchern musst du dann halt doch den Buchrücken etwas strapazieren, bzw sehr auf den Scanner aufdrücken was dieser nicht unbedingt gern hat (Erfahrungswerte). Ansonsten wirds dann halt in der Mitte dunkel (manchmal auch schwer lesbar) und die Ränder beim späteren bearbeiten (sofern du das vor hast) an der Innenseite recht kurz.
Wenn die Cops kommen, würde ich das bei der Verhandlung eher als Argument meiner weißen Seite vortragen.
Ansichtssache.
Wenn bei dir im Regal das Pädo Einmal Eins steht haben sie Blut geleckt und fühlen sich vielleicht genötigt noch etwas mehr zu suchen. Das ist wie wenn bei dir ein Bild von Osama bin Laden an der Wand hängen würde anstatt eines mit Naturlandschaft und einem röhrenden Hirsch.
Ich will vorallem ein paar Artikel aus Fachzeitschriften scannen.
Die es auch noch nicht online gibt?


Bei OCR Software würde ich mir einfach Abby Finereader besorgen. Das Programm eignet sich auch zum Scannen, Seiten bearbeiten usw. Besonders ältere Bücher machen teilweise Probleme bei der Texterkennung, theoretisch muss man da überall nochmal drüberlesen was allerdings ziemlich viel Arbeit ist.

Re: otr software

von Mitleser » 25.07.2011, 23:14

Ich habe in Sachen OCR-Programmen bisher nur Abby Fine Reader und Omnipage ausprobiert, das ging je nach Scanqualität recht gut. Mit Adobe Acrobat habe ich auch schon einmal gearbeitet, funktioniert ebenfalls recht brauchbar. Ob die Freeware-Tools etwas taugen, vermag ich nicht zu sagen, da solltest Du mal im Netz nach entsprechenden Erfahrungsberichten suchen. Ein Flachbettscanner ist vor allem für dickere Bücher nicht besonders gut geeignet, da wäre ein spezieller Buchscanner schon besser. Zur Not kann man sich ja mit einer Digitalkamera und einer entsprechenden (ggf. selbstkonstruierten) Halterung behelfen, das dürfte auch deutlich schneller gehen, als das Buch für jede Seite wieder vom Scanner zu nehmen und umzublättern. Anleitungen dafür finden man im Netz ebenfalls.

Re: otr software

von otr » 25.07.2011, 23:06

oCr und nicht oTr :o) okay.

nun finde ich auch wieder etwas...
hat jemand schon eines der folgenden getestet und kann vergleichen?
OCRopus
GOCR
CuneiForm
Ocrad
Tesseract



Bei sehr dicken Büchern bekommst du am inneren Rand nach ner Weile Probleme weils schräg wird. Ist zwar nicht hübsch aber meist noch lesbar. Soweit ich weiß können auch manche Programme das teilweise beheben (Abby Finereader).
Ich erwarte keine Bilder, sondern reinsten Text! Da sollte das Problem ja nicht mehr bestehen...
Falls das Buch dir gehört kannst du es auch zerfleddern und jede Seite einzeln einscannen. Das Buch ist dann zwar hin und ein Fall für den Müll. Für den unmöglichen Fall das die Lolizei mal bei einem vorbeiguckt ist das aber nicht unbedingt von Nachteil.
Interessante Idee. Aber das meiste sind ja Sammlerstücke und die zu zerfleddern wäre Sünde. Wenn die Cops kommen, würde ich das bei der Verhandlung eher als Argument meiner weißen Seite vortragen.
Alte themenrelevante Bücher gibts auch schon teilweise im Netz. Magst du evtl die Titel die dir vor Augen schwebten verraten?
Da gibts bald (wenns so geht, wie ich wünsche) eine Adresse unter der man so einiges bekommt. Bei manchen (schon gescanten) besteht noch ein moralisches Copyright, einige sind wirklich frei verfügbar.
Ich will vorallem ein paar Artikel aus Fachzeitschriften scannen. Was Bücher angeht, will ich mit diesem beginnen. ISBN: B001DAYWYG

Link gelöscht. GLF-Moderation

Da nun editiort werden muss, kann das ganze Threadhijackig, was ich ja total nicht leiden kann, auch mal gelöscht werden. :p

Re: otr software

von Terra » 25.07.2011, 18:54

Themenbezogene noch nicht unbedingt ... Bei den anderen war natürlich schon das Copyright abgelaufen :twisted:
Ansonsten wie hier schon mehrfach gesagt ein Flachbrustscanner. Am besten wäre natürlich ein Buchscanner. Das hängt von deinen Ansprüchen ab. Bei sehr dicken Büchern bekommst du am inneren Rand nach ner Weile Probleme weils schräg wird. Ist zwar nicht hübsch aber meist noch lesbar. Soweit ich weiß können auch manche Programme das teilweise beheben (Abby Finereader). Dafür ist dann eben der Buchscanner gut der das teilweise verhindert. Falls das Buch dir gehört kannst du es auch zerfleddern und jede Seite einzeln einscannen. Das Buch ist dann zwar hin und ein Fall für den Müll. Für den unmöglichen Fall das die Lolizei mal bei einem vorbeiguckt ist das aber nicht unbedingt von Nachteil. Nachteil vom Buchscanner ist eben der deutlich höhere Preis.
Alte themenrelevante Bücher gibts auch schon teilweise im Netz. Magst du evtl die Titel die dir vor Augen schwebten verraten?

Re: otr software

von Sandy » 25.07.2011, 18:42

Vernehme ich hier das Wort "Flach"....?

Erinnert mich an....Flach-machen; Flach-legen; Flach-Dach; Flach-sein; Flach-atmen; Flach..........

Omnipage ist gut seit je her!

Re: otr software

von Windbeutel » 25.07.2011, 18:38

Flach ist immer gut :D sei es nun scanner, flachmann, oder.... andere..

Nach oben