Selektive høstninger

Starttidspunkt for opsamling og evt. stop for opsamling ved nedlæggelse af websted.

Se også oversigten over tværsnitshøstninger, begivenhedshøstninger og oversigten over Heritrix Versioner

Netsted

Type

Fra dato

Til dato

Bemærkninger

aarhusvest.dk

2

2008-01-18

 

 

altfordamerne.dk

1

2010-03-25

 

 

altinget.dk

1

2005-07-01

 

Fra 2005-10-27 med ip-validering

amine.dk

3

2008-04-03

 

 

andersfogh.dk

3

2007-11-30

2009-06-29

 

aoa.dk

1

2010-02-15

 

 

arbejderen.dk

1

2006-08-29

 

 

arla.dk

2

2008-01-08

 

 

artnode.org

3

2007-08-14

2008-04-03

 

arto.com

3

2008-12-16

 

Fra 2008-12-16 med login

arto.dk

3

2007-12-14

2009-01-05

Fra 2007-12-17 med login. Fra 2009-01-05 som arto.com

autograf.org

3

2007-08-14

2008-11-14

 

avisen.dk

1

2006-10-11

 

 

berlingske.dk

1

2005-07-01

 

Videoer (2008-10-27) og billedserier - flashvisning, [2010-03-25) kan pt. ikke høstes

bibstream.dk

3

 

 

Relevant, men kan ikke høstes pga. video (2008-11-03)

blogtoppen.dk

3

2010-03-09

 

 

borgerligtcentrum.dk

2

2009-01-07

2010-02-15

Videoer kan pt. ikke høstes (2009-02-16)

bornholmstidende.dk

1

2006-12-18

 

 

borsen.dk

1

2006-08-22

 

Videoer kan pt. ikke høstes (2008-11-27)

bt.dk

1

2005-07-01

 

Videoer kan pt. ikke høstes (2008-11-28)

business.dk

1

2007-01-16

 

Fra 2008-01-08 med login

carblock.dk

3

2007-09-14

2008-04-03

 

chilinet.dk

3

2005-07-01

 

 

cnn.dk

1

2005-07-01

2007-11-30

 

comon.dk

1

2007-11-20

 

 

da.dk

2

2007-08-14

2009-10-15

Kun forsiden kan høstes, da høsteren ikke kan tage url'erne til undersiderne (indeholder "?")

dagbladetonline.dk

1

2006-12-18

 

 

danskespil.dk

2

2008-01-08

2008-05-30

Kan ikke høstes pga. flash

danskfolkeparti.dk

2

2005-07-01

 

 

dansk-politik.dk

1

2009-05-22

 

I perioden: 2009-05-22 til 2010-03-08 kun delvist høstet og med fejl

dansk-politik.tv

2

2007-12-18

2008-02-14

Netstedet nedlagt

dato.dk

1

2006-08-17

2007-11-26

Herefter redirect til urban.dk

di.dk

2

2008-04-03

 

 

dinby.dk

2

2008-09-30

 

Kan ikke høste de eksterne nyheder, begivenheder og mashups (indlejrede interaktive kort mv.)

ditcentrum.nordjyske.dk

1

2006-08-17

2009-10-22

Er blevet til kummulativ brugersite, der kan fanges af tværsnit

dkbn.dk

3

2008-12-14

2009-09-27

Nedtaget pga. høstningsproblem med dynamiske url'er.

dk4.dk

1

2005-07-01

2009-01-29

 

dr.dk

1

2005-07-01

 

 

drv.dk

 

2005-07-01

2007-12-09

 

dvoted.net

3

2007-12-11

 

 

eb.dk

1

2005-07-01

2007-01-30

Herefter som ekstrabladet.dk

ekstrabladet.dk

1

2005-07-01

 

 

ekstrabladet.tv

1

 

 

Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)

enhedslisten.dk

2

2005-07-01

 

 

e-pages.dk

1

2008-03-14

 

Høstes som hjælpesite til e-aviser, men fungerer i de fleste tilfælde ikke

epn.dk

1

2007-01-30

 

Problemer med høstning pga. den anvendte teknologi

erhvervsbladet.dk

1

2005-07-01

 

 

euroinvestor.dk

 

2005-07-01

 

 

facebook.com

2

2010-01-26

 

danske profiler/grupper høstes lejlighedsvis (når der er stor aktivitet og deres levetid er usikker)

fairforandring.dk

1

 

 

relevant, men kan ikke høstes pga. den anvendte teknologi

fairlosning.dk

1

 

 

relevant, men kan ikke høstes pga. den anvendte teknologi

filmstriben.dk

3

 

 

opfølger af bibstream.dk, relevant, men indholdet (streamet video) kan pt. ikke høstes

finansnyheder.dk

1

2006-10-12

 

 

flygtning.dk

 

2007-08-21

2010-05-18

 

folketinget.dk

 

2005-07-01

 

 

forum.dk

3

2008-06-14

2008-10-03

Høstes med login. Fra 2008-10-03 som sondagsavisen.dk

fpn.dk

 

2008-05-20

 

 

fyens.dk

1

2005-07-01

 

Fra 2007-11-08 med login. Videoer virker stort set ikke (2009-01-20)

helle-tv.dk

3

 

 

Relevant, men kan ikke høstes pga. vidoer (2009-03-20)

idag.dk

1

2006-08-29

 

 

indblik.nu

1

 

 

Høstes med login

infopaq.dk

 

2005-07-01

2007-12-17

 

information.dk

1

2005-10-11

 

Fra 2007-11-08 med login, Fra 2008-11-04 intet login-indhold, Fra 2009-10-06 igen login-indhold

ing.dk

 

2006-08-29

 

Fra 2008-01-09 med login

islam.dk

2

2007-12-01

2009-02-09

 

j.dk

2

2008-09-14

 

 

jiyan.dk

1

2010-05-17

 

 

jp.dk

1

2005-07-01

 

videopklip fra http://jp.dk/jptv/ kan pt. ikke høstes (20081215)

jubii.dk

3

2005-07-01

2008-06-27

 

jv.dk

 

2005-07-01

 

 

kanal4.dk

 

2007-12-11

2008-09-23

 

kanal5.dk

 

2007-12-11

2008-09-23

 

kd.dk

2

2005-07-01

2010-02-09

Høstning opgivet pga. tekniske problemer med url.

kino.dk

3

2009-01-27

2010-02-15

Høstning opgivet pga. videoproblemer

kl.dk

 

2007-11-27

 

 

konservative.dk

2

2005-07-01

 

 

kopenhagen.dk

3

2007-11-21

2010-02-05

 

kristeligt-dagblad.dk

1

2005-07-01

 

 

kunsport.dk

1

2008-10-27

2009-02-05

Domæne ophørt

larsloekke.dk

3

2009-04-28

 

Videoer kan pt. ikke høstes (2009-04-28)

lbl.dk

2

2007-12-18

 

 

liberalalliance.dk

2

2008-09-16

 

Tidligere nyalliance.dk

licitationen.dk

1

2007-11-20

 

Fra 2007-12-05 med login

ligetil.nu

1

2009-01-22

 

 

lo.dk

2

2007-08-21

 

 

lokalia.dk

2

2010-05-17

 

Kan ikke høstes korrekt pga. problemer med mashups (indlejrede interaktive kort mv.)

lokalavisen.dk

1

2010-05-17

 

 

minoritetspartiet.dk

2

2005-07-01

2007-12-09

 

mediawatch.dk

1

2007-12-18

 

Fra 2008-10-25 med login, Fra 2008-06-13 intet login-indhold

metroxpress.dk

1

2005-07-01

 

 

mobsites

1

2010-04-08

 

Nyhedsmediernes mobsites høstes samlet pga. teknisk lighed

modkraft.dk

3

2007-11-27

 

 

musiknyt.dk

3

2009-01-30

 

 

mymusic.dk

3

2007-11-27

2009-06-27

Fra 2007-12-05 med login. 2009-06-27 redirect til bandbase.dk uden login.

news.dk

1

2008-03-14

 

 

newspaq.dk

1

2007-04-18

2008-11-12

 

nordjyske.dk

1

2005-07-01

 

 

nutv.dk

3

 

 

Relevant, men kan ikke høstes pga. video (2008-11-03)

nyalliance.dk

2

2007-09-25

2008-09-09

Herefter som liberalalliance.dk

nyhedsavisen.nu

 

2006-08-17

2007-11-26

Herefter som avisen.dk

oplysningskontoret.dk

3

2008-10-28

 

2009-03-25 relevant vidoe-materiale høstes ikke

overskrift.dk

1

2007-05-15

 

 

parentesslut.dk

1

2010-03-08

 

 

partietfokus.dk

2

2010-03-30

 

 

partofthegame.tv

3

 

 

2008-11-27: Relevant, men kan ikke høste den anvendte teknologi (video)

peterdyreborg.wordpress.com

3

2007-11-21

2008-10-27

 

planet.sfit.dk

 

2008-01-29

 

 

politiken.dk

1

2005-07-01

 

Fra 2008-01-09 med login

politiken.tv

1

 

 

2008-09-11 relevant video-materiale, men kan ikke høstes

politisk.tv

 

2008-12-23

2010-03-11

Ikke opdateret siden juni 2009, kummulativ

radikale.dk

2

2005-07-01

 

 

radio100fm.dk

 

2005-07-01

2008-06-26

 

radionyhederne.dk

 

2008-01-24

2009-05-22

Sitet er lukket pr. 1.3.2009

rbb-online.dk

 

2009-05-07

 

erstatter rb-borsen.dk

rb-borsen.dk

 

2005-10-11

2009-05-07

erstattet af rbb-online.dk

redcross.dk

2

2007-12-18

 

 

religion.dk

2

2009-07-03

 

 

ritzau.net

1

2008-09-30

 

Høstes med login, 2009-08-31: login-problem

ritzauinfo.dk

1

2008-09-30

 

 

sbsnet.dk

 

2007-12-11

2008-11-12

 

scm.dk

 

2008-01-21

 

 

seismograf.org

3

2007-12-14

2008-12-15

Netstedet nedlagt

seoghoer.dk

 

2008-09-15

 

 

sf.dk

2

2005-07-01

 

 

socialdemokraterne.dk

2

2005-07-01

 

 

socialdemokraterne-tv.dk

2

 

 

2009-03-20: Relevant, men kan ikke høste den anvendte teknologi (video)

socialdemokratiet.dk

2

2005-07-01

2007-12-11

Herefter som socialdemokraterne.dk

sondagsavisen.dk

 

2005-10-11

 

Fra 2008-01-07 inkl. den daglige avis i pdf

spn.dk

 

2009-04-07

 

Flash kan pt ikke høstes 2009-04-27

sporten.dk

 

2008-11-13

 

 

statstidende.dk

 

2005-11-02

 

 

stiften.dk

1

2006-08-21

 

 

torshammer.dk

 

2005-07-01

2007-11-30

 

tvkilde.com

3

 

 

Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)

tv2.dk

 

2005-07-01

 

 

tv3.dk

 

2005-07-01

 

 

ulk.dk

3

2009-02-14

2009-05-27

Videoer kan pt. ikke høstes (2009-04-08)

ungnyt.dk

1

2010-01-28

 

 

urban.dk

1

2007-04-18

 

 

venstre.dk

2

2005-07-01

 

 

vix.dk

3

2010-03-25

 

 

webmuseum.dk

3

2010-03-27

 

Fortsættelse af webmuseum.re-cph.com

webmuseum.re-cph.com

3

2009-03-14

2010-02-27

Fortsættes som webmuseum.dk

weekendavisen.dk

1

2005-07-01

 

Fra 2008-01-09 med login

woman.dk

1

2010-04-07

 

 

xstream.dk

1

2009-02-13

 

Høstes for at få nogle sider med videoer fra berlingske.dk m.fl.

youtube.com

3

 

 

Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)

Zmags.com

 

2008-03-31

2009-09-10

 

180grader.dk

1

2007-05-25

 

 

24timer.dk

 

2006-08-17

 

 

24timerxtra.dk

 

2007-10-30

2009-03-19

Nedtaget, da der omdirigeres til fyens.dk

3f.dk

 

2007-08-21