Kontaktperson
Olof Mogren
Senior Researcher
Kontakta OlofKaffe är en av de mest populära och värdefulla dryckerna i världen, med ett uppskattat globalt marknadsvärde på över 100 miljarder US-dollar. Kaffeproduktionen står dock inför många utmaningar, såsom klimatförändringar, skadedjur, sjukdomar och marknadsfluktuationer.
Ett av de allvarligaste hoten mot kaffeodlingen är coffee berry disease (CBD), en svampinfektion som gör att bären ruttnar och faller av växten. CBD kan minska avkastningen och kvaliteten på kaffe med upp till 80% och påverkar miljontals småbönder i Afrika, Asien och Latinamerika.
För att förebygga och kontrollera CBD måste odlarna övervaka sina växter regelbundet och använda bekämpningsmedel. Detta kan vara kostsamt, tidskrävande och en belastning för miljön. Dessutom har bönderna inte alltid tillgång till tillförlitlig information eller verktyg för att diagnostisera CBD exakt och i tid. Det är här maskininlärning, en typ av artificiell intelligens som gör det möjligt för datorer att lära av data och göra förutsägelser, kan erbjuda en lösning.
I ett forskningsprojekt på RISE har vi utvecklat en effektiv maskininlärningsbaserad lösning för att känna igen CBD i bilder av kaffeplantor. Projektet syftar till att tillhandahålla ett billigt, skalbart och korrekt verktyg för odlare att övervaka sina kaffeplantor och vidta lämpliga åtgärder för att förebygga eller behandla CBD.
I projektet samlades en datamängd in av våra samarbetspartners Mpendakazi Agribusiness i Tanzania. Datamängden består av några hundratal bilder. Dessa behöver annoteras, en av de mest tidskrävande uppgifterna inom maskininlärning. När det gäller att känna igen och räkna objekt i bilder kräver det att experter manuellt ritar rutor runt objekten i varje bild. För att minska denna arbetsbörda har vi utvecklat en ny metod som kombinerar svaga och starka annoteringar. Svaga annoteringar är i detta fall punktannoteringar som markerar mitten av ett objekt, medan starka annoteringar är rutor som omsluter hela objektet. I projektet har vi använt generella maskininlärningsmodeller som kan upptäcka godtyckliga objekt utan specifik träning, för att generera förslag på var bären finns i bilderna. De mänskliga annotatörerna behöver då bara sätta dit punktannoteringar för de återstående objekten i varje bild, vilket är mycket snabbare och enklare än att rita rutor.
Vi har också utvecklat maskininlärningsmodeller som kan lära sig av bilderna och deras annoteringar. Modellerna baserades på ramverket YOLOv8, som är en modern modell för objektdetektering. Denna modifierades för att fungera med kombinationen av svaga och starka annoteringar. Projektet har undersökt två strategier för denna uppgift: Point-guided Loss Suppression (PLS) och Mixed Point-Teaching (MPT).
PLS-modellen är en enkel anpassning av YOLOv8, som använder en kostnadsfunktion som straffar modellen för att bestämma rutor som inte matchar annoteringarna, för både punkter och rutor. MPT-ramverket består av två modeller, en som genererar rutor som den andra sen använder som pseudoannoteringar under träning. Pseudoannoteringarna är alltså syntetiska annoteringar som genereras av en lärarmodellen. MPT-ramverket syftar till att utnyttja de två modellernas styrkor och förbättra deras prestanda när de kombineras.
Prestandan för de utvecklade modellerna utvärderades på en separat del av de insamlade CBD-bilderna. Modellerna jämfördes med baslinjen YOLOv8 och en semi-övervakade YOLOv8, som endast använder rutor för träning.
Utvärderingsresultaten visar att PLS-modellen ger en förbättring av prestanda på CBD-bilderna, jämfört med den semi-övervakade modellen. MPT-ramverket presterar i allmänhet sämre, och slår baslinjen endast i ett fåtal fall. Den exakta tidsbesparingen av att använda punktannoteringar är svår att fastställa, men resultaten tyder på att det finns potentiella användningsfall där annoteringspunkter är effektivare än rutor, särskilt med vidareutveckling av modellerna.
Detta forskningsprojekt har utvecklat en effektiv maskininlärningslösning för att detektera CBD i bilder av kaffeplantor, och jämfört olika metoder för att annotera datamängder med svaga och starka annoteringar. Projektet har i detta tidiga skede kommit med flera bidrag inom området maskininlärning och jordbruk, såsom:
Projektet har hittills identifierat ett antal aktiviteter som kommer att undersökas i framtida arbete:
Forskningsprojektet visar hur maskininlärning kan hjälpa kaffeodlare att hantera coffee berry disease, och hur denna teknik kan vidareutvecklas för att gynna jordbruk i allmänhet. Projektet hoppas kunna vara inspiration för mer forskning och innovation inom detta område, och bidra till de globala målen för livsmedelsförsörjning, fattigdomsbekämpning och miljöskydd.
Maskininlärning för coffee berry disease
Pågående
Koordinator
2 år