Den svenska trädbanken är resultatet av ett arbete som har utförts av forskare vid universiteten i Uppsala (Datorlingvistik, Institutionen för lingvistik och filologi) och Växjö (Språkteknologigruppen vid Matematiska och systemtekniska institutionen). Trädbanken är resultatet av en harmonisering av den lingvistiska informationen i två befintliga svenska språkresurser:
I korthet har harmoniseringen gått till så att Talbanken försetts med SUC:s ordklassetiketter i en halvautomatisk process, och både Talbanken och SUC har försetts med en frasstrukturversion av Talbankens syntaktiska annotation. Den senare processen har varit helautomatisk, vilket innebär att man kan förvänta sig felaktigheter i den syntaktiska annotationen, särskilt i SUC-korpusen. En preliminär utvärdering av annotationen presenterad vid en workshop i samband med SLTC 2008 visar att den syntaktiska annotationen ändå är till mycket god hjälp vid korpuslingvistiska undersökningar.
Den svenska trädbanken distribueras i ett format som kallas TIGER-XML, så att den ska kunna användas med det fritt tillgängliga sökverktyget TIGERSearch, som kan laddas ner från Institut für Maschinelle Sprachverarbeitung vid universitetet i Stuttgart.
Trädbanksdelen - d.v.s. de nytillagda syntaktiska annotationerna - av den svenska trädbanken är helt fri, med en öppen källkodslicens.
Talbanken är fritt tillgänglig för forskning och undervisning. Den kan laddas ned här
SUC kräver att varje användare tecknar en individuell licens med Institutionen för lingvistik vid Stockholms universitet. Från och med den 1/12 2008 är licensieringen av SUC delegerad till Språkbanken vid Göteborgs universitet. SUC-licensavtalet kan laddas ner i pdf-format här. Läs mer om SUC2 och SUC3 här
För att erhålla SUC (och därmed den svenska trädbanken) behöver du skriva ut och skriva under licensavtalet och sedan skicka det till
SUC-licens
Språkbanken
Institutionen för svenska, flerspråkighet och språkteknologi
Göteborgs universitet
Box 200
405 30 Göteborg
Därefter återkommer vi per epost med nerladdningsinstruktioner.
Den svenska trädbanken distribueras av Språkbanken. Se instruktioner i föregående avsnitt eller kontakta oss för mer information genom att använda detta kontaktformulär.
Den som redan har skrivit på en SUC-licens får direkt nedladdningsadress och lösenord från oss. Använd kontaktformuläret. Övriga behöver först skriva under ett licensavtal för SUC (se ovan).
Om du vill citera Svensk trädbank i en artikel rekommenderar vi att du använder följande referens: