Skip to main content

Använda mbox-formatet för att lagra e-post på din hårddisk

What is MBOX file & How to Convert MBOX Files (April 2025)

What is MBOX file & How to Convert MBOX Files (April 2025)
Anonim

Det vanligaste formatet för lagring av e-postmeddelanden är mbox-formatet. MBOX står för MailBOX. En mbox är en enda fil som innehåller noll eller flera mailmeddelanden.

Mbox-formatet

Om vi ​​använder mbox-formatet för att lagra e-postmeddelanden sätter vi dem alla i en fil. Detta skapar mer eller mindre lång textfil (Internet-e-post finns alltid endast som 7-bitars ASCII-text, allt annat - bifogade filer, till exempel - är kodade) innehåller ett e-postmeddelande efter det andra. Hur vet vi var man slutar och en annan börjar?

Lyckligtvis har varje e-post minst en från-linje i början. Varje meddelande börjar med "Från" (Från följt av en vit mellanslagstecken, kallas också en "From_" -linje). Om denna sekvens ("Från") i början av en rad föregås av en tom linje eller ligger högst upp i filen, har vi hittat början på ett meddelande.

Så vad vi letar efter när man analyserar en mbox-fil är i huvudsak en tom linje följd av "Från".

Som ett vanligt uttryck kan vi skriva detta som " n nFrom. * N". Bara det första meddelandet är annorlunda. Det börjar bara med "Från" i början av en rad ("^ Från. * N").

"Från" i kroppen

Vad händer om exakt sekvensen ovan visas i ett e-postmeddelande? Vad händer om följande ingår i ett e-postmeddelande?

  • … Jag skickar dig den senaste rapporten.
  • Från den här rapporten behöver du inte …

Här har vi en tom linje följt av "Från" i början av raden. Om det här visas i en mbox-fil, har vi otvetydigt början på ett nytt meddelande. Det är åtminstone det som parsaren tycker och varför både e-postklienten och vi skulle vara ganska förvirrade av ett e-postmeddelande som inte innehåller avsändare eller mottagare men börjar med "Från denna rapport".

För att undvika sådana katastrofala förhållanden måste vi se till att "Från" aldrig dyker upp i början av en rad efter en tom linje i en e-postadress.

När vi lägger till ett nytt meddelande till en mbox-fil söker vi efter sådana sekvenser i kroppen och ersätter helt enkelt "Från" med "> Från". Detta gör missförståelser omöjliga. Exemplet ovan ser nu ut så här och triggar inte heller parsern:

  • … Jag skickar dig den senaste rapporten.
  • > Från den här rapporten behöver du inte …

Därför kan du ibland hitta "> Från" i ett e-postmeddelande där du bara förväntar dig "Från".