/ Forside / Teknologi / Multimedie & design / Andet multimedie / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Andet multimedie
#NavnPoint
refi 19159
Klaudi 13515
severino 5400
pallebhan.. 4553
molokyle 4203
o.v.n. 3762
tedd 3707
bentjuul 3670
transor 2817
10  miritdk 2644
Fra billede til tekst
Fra : Kasper Okkels


Dato : 23-11-02 14:02

Jeg har et 50 siders Word-dokument med omkring 100 skærmdump, som jeg gerne
vil have konverteret til et læsbart format? Skærmbillederne har alle formen

-----------------------------------------------
tekst tekst tekst 034345 tekst
tekst tekst tekst 047675 tekst
tekst tekst tekst 032345 tekst
tekst tekst tekst 345344 tekst
----------------------------------------------

og det er i princippet bare tallene, jeg er interesserede i. Findes det er
program, der direkte kan tage en word-fil - pille grafikken ud -- og give et
læsbart output? Hvis det går helt galt, så kan jeg vel gemme de enkelte
skærmdumps som individuelle billeder, og så køre dem gemmen et
"grafik-til-tekst"-program. Men hvilket? En demoversion eller freeware vil
være at foretrække, men det er ikke noget krav.

mvh
Kasper



 
 
emj (23-11-2002)
Kommentar
Fra : emj


Dato : 23-11-02 14:13

On Sat, 23 Nov 2002 14:01:46 +0100, "Kasper Okkels"
<okkelsFJERN_DETTE@wanadoo.dk> wrote:

>Findes det er
>program, der direkte kan tage en word-fil - pille grafikken ud -- og give et
>læsbart output?

Hvis du gemmer fra Word som
"gem som webside"
så får du billeder serveret i en mappe på for sig selv.
Hilsen emj


Kasper Okkels (23-11-2002)
Kommentar
Fra : Kasper Okkels


Dato : 23-11-02 15:37

"emj" <emj@mail1.stofanet.dk> skrev i en meddelelse
news:nfvutuc4t9oblrju57i5jhqhn34on5c7hs@4ax.com...
> Hvis du gemmer fra Word som
> "gem som webside"
> så får du billeder serveret i en mappe på for sig selv.

Ahh, fikst. Så mangler jeg bare et program, der kan lave det om fra
jpg/png-billeder til tekst/excel-format.

/Kasper



Studio Smalbro (23-11-2002)
Kommentar
Fra : Studio Smalbro


Dato : 23-11-02 16:53

så skal du bruge et ocr program som Fine Reader eller OmniPage Pro. Der
findes en masse af den slags til download fra www.download.com

Kh
Bjørn



Kh
Bjørn
"Kasper Okkels" <okkelsFJERN_DETTE@wanadoo.dk> wrote in message
news:3ddf9c96$0$234$edfadb0f@dread15.news.tele.dk...
> "emj" <emj@mail1.stofanet.dk> skrev i en meddelelse
> news:nfvutuc4t9oblrju57i5jhqhn34on5c7hs@4ax.com...
> > Hvis du gemmer fra Word som
> > "gem som webside"
> > så får du billeder serveret i en mappe på for sig selv.
>
> Ahh, fikst. Så mangler jeg bare et program, der kan lave det om fra
> jpg/png-billeder til tekst/excel-format.
>
> /Kasper
>
>



Anders Rehhoff (23-11-2002)
Kommentar
Fra : Anders Rehhoff


Dato : 23-11-02 14:41

Hej Kasper

Er det læsbart eller redigerbart?

mvh
Anders Rehhoff

"Kasper Okkels" <okkelsFJERN_DETTE@wanadoo.dk> skrev i en meddelelse
news:3ddf7bf6$0$171$edfadb0f@dread15.news.tele.dk...
> Jeg har et 50 siders Word-dokument med omkring 100 skærmdump, som jeg
gerne
> vil have konverteret til et læsbart format? Skærmbillederne har alle
formen
>
> -----------------------------------------------
> tekst tekst tekst 034345 tekst
> tekst tekst tekst 047675 tekst
> tekst tekst tekst 032345 tekst
> tekst tekst tekst 345344 tekst
> ----------------------------------------------
>
> og det er i princippet bare tallene, jeg er interesserede i. Findes det er
> program, der direkte kan tage en word-fil - pille grafikken ud -- og give
et
> læsbart output? Hvis det går helt galt, så kan jeg vel gemme de enkelte
> skærmdumps som individuelle billeder, og så køre dem gemmen et
> "grafik-til-tekst"-program. Men hvilket? En demoversion eller freeware vil
> være at foretrække, men det er ikke noget krav.
>
> mvh
> Kasper
>
>



Kasper Okkels (23-11-2002)
Kommentar
Fra : Kasper Okkels


Dato : 23-11-02 15:37

"Anders Rehhoff" <artryk@post11.tele.dk> skrev i en meddelelse
news:3ddf84c2$0$133$edfadb0f@dread13.news.tele.dk...

> Er det læsbart eller redigerbart?

Billederne er skærmprint fra en dialogboks. Når jeg gemmer som web-side i
word får jeg 100 jpg eller png-billeder ud af det. Et eksempel er lagt i
dk.binaer.

mvh
Kasper



Anders Rehhoff (23-11-2002)
Kommentar
Fra : Anders Rehhoff


Dato : 23-11-02 16:47

Undskyld Kasper at jeg ikke udtrykte mig klart.

Skal du kunne redigere i teksten, eller skal du "bare" kunne se dem
tydeligt?

"Kasper Okkels" <okkelsFJERN_DETTE@wanadoo.dk> skrev i en meddelelse
news:3ddf9c97$0$234$edfadb0f@dread15.news.tele.dk...
> "Anders Rehhoff" <artryk@post11.tele.dk> skrev i en meddelelse
> news:3ddf84c2$0$133$edfadb0f@dread13.news.tele.dk...
>
> > Er det læsbart eller redigerbart?
>
> Billederne er skærmprint fra en dialogboks. Når jeg gemmer som web-side i
> word får jeg 100 jpg eller png-billeder ud af det. Et eksempel er lagt i
> dk.binaer.
>
> mvh
> Kasper
>
>



Kasper Okkels (23-11-2002)
Kommentar
Fra : Kasper Okkels


Dato : 23-11-02 20:18

"Anders Rehhoff" <artryk@post11.tele.dk> skrev i en meddelelse
news:3ddfa251$0$248$edfadb0f@dread13.news.tele.dk...
> Undskyld Kasper at jeg ikke udtrykte mig klart.
>
> Skal du kunne redigere i teksten, eller skal du "bare" kunne se dem
> tydeligt?

Det er ikke noget problem at læse teksten tydeligt. Det, jeg skal bruge, er
en liste - i Excel, eksempelvis - med alle tal-værdierne. De skal bruges som
input til det videre arbejde. Det er for at slippe for skrive samtlige
1000-1500 værdier ind manuelt. Så svaret må være, at jeg skal kunne redigere
i dem.

mvh
Kasper



Anders Rehhoff (23-11-2002)
Kommentar
Fra : Anders Rehhoff


Dato : 23-11-02 21:58

Hej Kasper

Så begynder der at være noget kød på sagen. Som Bjørn smalbro har skrevet
tildligere, så vil jeg også anbefale dig at bruge Omnipage, det er et lille
tekstgenkendelses program, som gør at at du kan redigere i teksten (arbejde
videre med den).

Så nævner du Excel - Skal du beregne videre på tallene? Eller er det "kun"
til dokumentation?

Hvis det "kun" er til dokumentation, så har du mulighed for at (fra
Omnipage) gemme teksten som RTF, som du kan importere i alle Windows baseret
programmer.

Hvis du skal beregne på svineriet, så er jeg straks på mere gyngende grund,
for jeg aner ikke hvordan du får data ind i f.eks. Excel pr. automatik. Der
er et eller andet som foresvæver mig om at Corel Ventura muligvis kan hjælpe
dig, med det lille program som hedder Database Publisher (dette program kan
importere div database filer & *.txt filer), som er en del af Corel Ventura.
Men her er jeg bestemt ikke stærk - men jeg ved at der er andre i denne NG
som ved en del om Corel Ventura's Database Publisher.

Så Kasper - Lad os høre, helt præcist hvad dine ønsker går ud på - efter du
har fået dine data i redigerbar form. Det er ikke sikkert at jeg kan bidrage
med yderligere, men så kan andre måske tage over.

mvh
Anders Rehhoff

"Kasper Okkels" <okkelsFJERN_DETTE@wanadoo.dk> skrev i en meddelelse
news:3ddfd413$0$159$edfadb0f@dread13.news.tele.dk...
> "Anders Rehhoff" <artryk@post11.tele.dk> skrev i en meddelelse
> news:3ddfa251$0$248$edfadb0f@dread13.news.tele.dk...
> > Undskyld Kasper at jeg ikke udtrykte mig klart.
> >
> > Skal du kunne redigere i teksten, eller skal du "bare" kunne se dem
> > tydeligt?
>
> Det er ikke noget problem at læse teksten tydeligt. Det, jeg skal bruge,
er
> en liste - i Excel, eksempelvis - med alle tal-værdierne. De skal bruges
som
> input til det videre arbejde. Det er for at slippe for skrive samtlige
> 1000-1500 værdier ind manuelt. Så svaret må være, at jeg skal kunne
redigere
> i dem.
>
> mvh
> Kasper
>
>



Kasper Okkels (01-12-2002)
Kommentar
Fra : Kasper Okkels


Dato : 01-12-02 20:04

"Anders Rehhoff" <artryk@post11.tele.dk> skrev i en meddelelse
news:3ddfeb9c$0$71699$edfadb0f@dread11.news.tele.dk...

> Så begynder der at være noget kød på sagen. Som Bjørn smalbro har skrevet
> tildligere, så vil jeg også anbefale dig at bruge Omnipage, det er et
lille
> tekstgenkendelses program, som gør at at du kan redigere i teksten
(arbejde
> videre med den).

Efter nogen tid, er jeg nu kommet i besiddelse af Omnipage. Eftersom I roser
programmet, så går jeg ud fra, at det er mig, der er noget galt med, for jeg
synes altså ikke det virker tilfredsstillende. Nu skriver jeg lige hvad jeg
har forsøgt mig med, og så hører jeg gerne forslag til hvordan jeg forbedrer
mig!

Mine billeder er nu gemt i jpg-format. De stammer oprindeligt fra et
[Alt]-[Prt Scr]-skærmprint - er kopieret til Word - og gemt som Webside. Om
det har ødelagt for meget af opløsningen ved jeg ikke. Et eksempel på mine
billeder findes i dk.binaer
news:3ddf9c99$0$234$edfadb0f@dread15.news.tele.dk....

Benytter jeg Wizard'en i programmet, får jeg noget værre krims-krams ud af
det. Her er det hverken til at finde hoved og hale i outputtet. Markerer jeg
"tabel-delen" (og vælger at det er en tabel), så får jeg et udmærket
outputformat, men med ualmindelig mange fejl. Et eksempel på kolonnen "DS
Code" (som er det eneste, jeg skal bruge fra billederne) er vist nederst.
Hvis man sammenligner med original-billedet (det fra dk.binaer), så er
ligheden jo altså ikke slående...

For at teste forsøgte jeg så at resample billedet til en bedre opløsning,
skrue op for kontrasten, pille ved intensiteten og skrue ned for lyset.
Visuelt synes jeg, at bogstaverne stod skarpere og klarere, men programmet
gav ikke bedre resultat.

Hvad gør jeg galt? Det duer ikke, hvis jeg skal ind og åbne alle 100
billeder for manuelt at "friske dem op" eller "skrue på nogle knapper". Det
bliver nødt til på en eller anden måde at køre som et batch-job - ellers kan
jeg lige så godt bide i det sure æble og skrive alle værdierne over via
håndkraft.

Håber på hjælp,
Kasper

PS: Det er ikke noget problem at få flyttet data fra OmniPage til Excel.

Eksempel på DS Code fra news:3ddf9c99$0$234$edfadb0f@dread15.news.tele.dk...
U 0
16077R
161051 i
116371H
j16590E
Ll 671411
1689%P"1
118122x'
111850:4
1185215
1185742
11858:2
119241,'%,
L 194111E
119704. i
1204042
12064SJ
2UE4 i%:
2i ISH,~~7




Anders Rehhoff (01-12-2002)
Kommentar
Fra : Anders Rehhoff


Dato : 01-12-02 22:22

Hej Kasper

Den erfaring som jeg har med Omnipage, er fra papir til redigerbar tekst.
Har du prøvet at printe en side ud, og derfra OCR jobbet?

Mvh
Anders



Kasper Okkels (04-12-2002)
Kommentar
Fra : Kasper Okkels


Dato : 04-12-02 19:02

"Anders Rehhoff" <artryk@post11.tele.dk> skrev i en meddelelse
news:3dea7cc1$0$71632$edfadb0f@dread11.news.tele.dk...

> Har du prøvet at printe en side ud, og derfra OCR jobbet?

Nej, og det vil heller ikke være en holdbar løsning i mit tilfælde. Det kan
godt være, at jeg kunne få et udmærket resultat, men hvis det betyder, at
jeg skal køre 50 sider gennem scanneren, så er besværret hermed alt for
stort.

Men tak for hjælpen. Nu må jeg i gang med manuelt at indtaste...

/Kasper



Søg
Reklame
Statistik
Spørgsmål : 177501
Tips : 31968
Nyheder : 719565
Indlæg : 6408527
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste