V22.0436 - Prof. Grishman Föreläsning 9 - MIPS instruktionsuppsättning binär aritmetisk MIPS-arkitektur, contd (text, kapitel 3) Granska grundläggande MIPS-instruktioner (text, Figur 4.6, s. 183) enhetliga 2-operativa aritmetiska och logiska instruktioner användning av register 0 som konstant 0 två-instruktionssekvens för filial på mindre än Sharp-kontrakt med CISC (komplexa instruktionsuppsättningar) arkitekturer som Intel 80x86 historiska krav på uppåtkompatibilitet med tidigare maskiner ledde till komplex design (8080 - gt 8086 - gt 80286 - gt 80386 etc.) nästan varje register har några speciella egenskaper operands för instruktioner kan komma från minnet eller registrera resultatet kan lagras i minnet eller registrera flera operandstorlekar flera instruktionslängder komplex maskindesign Kommer tillbaka till prestationsproblem senare i terminen Binära aritmetiska negativa tal: 2s komplement (text, kapitel 4.2) binär adder: ripple carry propagation delay (text, kapitel 4.3) subtraktion MIPS ALU (text, avsnitt 4.5) En ALU (ari thometic-logical unit) är en kombineringskrets som kan beräkna en rad olika aritmetiska och logiska funktioner. operationer som behövs för MIPS-instruktioner som hittills diskuterats: Lägg till, subtrahera, eller, nolltest, jämförelse MIPS har inte heller, xor multiplicera och dela generell strategi: olika kretsar kombinerat med multiplexer multiplexer välj blir funktionsval för ALU invertering B-ingång för subtraktion matningsutmatning av högordningsbit adder till lågordningsbit för quotset på mindrequotoperation använd ELLER-port på ALU-utgång för quotequalquot-test Bär framåt: introduktion enklaste adder är rippelbearbetning: långsam (fördröjningstid linjär i operandens storlek) Tilläggstiden är vanligtvis kritisk vid bestämning av den totala cykeltiden för en maskin kan påskynda tillägget genom att införa begreppet bärgenerering och bära propagateMars 4.0 släpptes i augusti 2010. Förbättringar och buggfixar inkluderar: Kommer snart: Ny textredigerare (så snart vi lösa visningsproblem på Mac-datorer). Förbättrad instruktionshjälp: Alla instruktionsexempel i hjälpflikarna (och nya popup-instruktionsguider) använder nu realistiska registernamn, t. ex. t1, t2, i stället för 1, 2. Instruktionsformatnyckeln som visas ovanför MIPS-hjälpflikarna har utökats för att inkludera förklaringar av de olika adresseringslägena för instruktioner för last och butik och pseudoinstruktioner. Beskrivningar har lagts till i varje exempel instruktion och pseudo-instruktion. Förbättrad monteringsfelskapacitet: Om sammansättningsoperationen resulterar i fel kommer det första felmeddelandet i textområdet Mars-meddelanden att vara högt och motsvarande felaktiga instruktioner kommer att väljas i textredigeraren. Dessutom kan du klicka på något felmeddelande i textfältet Mars Meddelanden för att välja motsvarande felaktiga instruktioner i textredigeraren. Den första funktionen väljer inte i alla situationer (t. ex. när monteringen är öppen) men i de situationer där den inte fungerar är ingen skada slutförd, plus den andra funktionen som klickar på felmeddelanden kan fortfarande användas. Konsolinmatningssyskaler (5, 6, 7, 8, 12) som exekveras i IDE får nu inmatningsnycklar direkt i textrutan Kör IO istället för genom en popup-inmatningsdialog. Tack vare Ricardo Pascual för att tillhandahålla den här funktionen Om du föredrar popupdialogerna finns en inställning för att återställa dem. Golv-, tak-, trunk - och rundoperationerna producerar nu MIPS-standardresultatet 231-1 om värdet är oändligt, NaN eller utav 32-bitars intervall. För konsistens producerar sqrt-verksamheten nu resultatet NaN om operand är negativ (istället för att höja undantag). Dessa fall överensstämmer alla med FCSR (FPU Control och Status Register) Felaktig drift flagg är avstängd. Den ideala lösningen skulle vara att simulera FCSR-registret så att alla MIPS-specifikationer för flytpunkter kan implementeras, men det har inte hänt än. I kolumnen Grundläggande i fönstret Textsegment visas nu data och adresser i antingen decimal eller hexadecimal beroende på aktuella inställningar. Observera att adressen i filinstruktionerna faktiskt är en kompensation i förhållande till datorn, så behandlas som data som inte adresserar. Eftersom dataoperationer i grundinstruktionerna inte är längre än 16 bitar, innehåller deras hexadecimal visning endast 4 siffror. Kolumnen Källa i fönstret Text Segment bevarar nu flikavståndet för ett renare utseende (fliktecken har tidigare inte gjorts). Instruktionsmnemonik kan nu användas som etiketter, t. ex. b:. Ny syscall 36 kommer att visa ett heltal som en osignerad decimal. Ett nytt verktyg, Digital Lab Sim, bidrog av Didier Teifreto (dteifretolifc. univ-fcomte. fr). Det här verktyget har två sju-segmentskärmar, en hexadecimal knappsats och en räknare. Det använder MMIO för att utforska avbrott-driven IO i en engagerande inställning. Mer information finns i hjälpfunktionen. Tack så mycket MARS 4.0 kräver Java 1.5 (5.0) istället för 1.4. Om det här är ett problem för dig, låt mig veta. Mars 3.8 släpptes i januari 2010. Förbättringar och buggfixar inkluderar: En ny funktion för att tillfälligt stoppa brytpunkter som du tidigare ställt in. Använd det när du känner dig säker nog att köra ditt program utan brytpunkter men inte tillräckligt med säkerhet för att rensa dem. Använd alternativet Växla brytpunkter i menyn Kör eller klicka helt enkelt på kolumnrubriken Bkpt i fönstret Text Segment. Upprepa, för att återaktivera. Två nya Verktyg bidragit av Ingo Kofler vid Klagenfurt University i Österrike. En genererar instruktionsstatistik och den andra simulerar förhandsgranskning av grenar med hjälp av en grenhistorik tabell. Två nya skrivbordsskivor. Syscall 34 skriver ett heltal i hexadecimalt format. Syscall 35 skriver ett heltal i binärt format. Föreslagen av Bernardo Cunha i Portugal. En ny inställning för att kontrollera om MIPS-programräknaren kommer att initieras till uttalandet med global etiketthuvud om ett sådant uttalande finns. Om inställningen är avmarkerad eller om den är markerad och det inte finns någon huvud, kommer programräknaren att initieras till standard startadress. Utgåva 3.7 var programmerad för att initiera den automatiskt till det uttalade huvudet. Detta ledde till problem med program som använder standard SPIM exception handler exceptions. s eftersom det innehåller en kort ordningsföljd vid standard startadress för att göra någon initialisering sedan gren till huvud. Under 3,7 omstartades initialiseringssekvensen. Som standard är denna inställning avmarkerad. Det här alternativet kan anges i kommandot läge med hjälp av alternativet sm (Start vid huvud). Mars Verktyg som existerar utanför Mars kan nu inkluderas i Verktyg-menyn genom att placera dem i en JAR och inkludera det i ett kommando som startar Mars IDE. Till exempel: java - cp plugin. jarMars. jar Mars Tack till Ingo Kofler för att tänka på den här tekniken och tillhandahålla plåstret för att implementera det. Korrigeringar och allmänna förbättringar av MIDI syscalls. Tack till Max Hailperin från Gustavus Adolphus College för att leverera dem. Korrigering till en assembler bugg som flaggade felidentifierade ogiltiga MIPS instruktioner som direktiv. Mars 3.7 släpptes i augusti 2009. Förbättringar och buggfixar inkluderar: En ny funktion för att ändra adressutrymme konfiguration för den simulerade MIPS-maskinen. 32-bitars adressutrymme konfiguration som används av alla tidigare versioner är standard. Vi har definierat två alternativa konfigurationer för ett kompakt 32KB adressutrymme. Man startar textsegmentet i adress 0 och den andra startar datasegmentet i adress 0. Ett 32KB-adressutrymme tillåter vanliga använda pseudo-instruktioner för laddningsstorlek med hjälp av etiketter, till exempel lw t0, inkrement. att expandera till en enda grundläggande instruktion eftersom etikettens fullständiga adress kommer att passa in i 16-bitars adressförskjutningsfält utan att teckenupplänger sig till ett negativt värde. Detta gjordes som svar på flera förfrågningar under åren för mindre adresser och förenklade expansioner för att göra monteringsprogram lättare att förstå. Den här utgåvan inkluderar inte möjligheten att definiera din egen anpassade konfiguration, även om vi förutse att du lägger till den i framtiden. Den är tillgänglig både genom kommandot läge (alternativ mc) och IDE. Se Minneskonfiguration. längst ner i menyn Inställningar. I samband med föregående artikel: Lagra och lagra pseudoinstruktioner av formuläret lw t0, etikett och lw t0, kommer etiketten (t1) att expandera till en enda instruktion (addi för dessa exempel) om den nuvarande minneskonfigurationen säkerställer etiketterna fullständig adress kommer att passa in i 15-bitars låga ordning. Instruktioner för vilka detta genomfördes är: lw, lw, lh, lb, lhu, lbu, lwl, lwr, lwc1, ldc1, ls, ld, sw, sh, sb, swl, swr, sc, swc1, sdc1, ss och sd Om en fil innehåller ett globalt uttalande etikett huvud (utan citat, skiftlägeskänslig), kommer exekveringen att börja på det uttalandet, oavsett adress. Tidigare startade programkörningen alltid vid basadressen för textsegmentet. Det här kommer att vara användbart för flera filprojekt eftersom du inte längre behöver ha huvudfilen öppnad i redigeraren för att kunna köra projektet. Observera att huvudet måste förklaras globalt med hjälp av. globl-direktivet. Vi har lagt till en FindReplace-funktion för redaktören. Detta har varit en annan frekvent förfrågan. Öppna den via Edit-menyn eller Ctrl-F. Sök efter större förbättringar till redaktören 2010 Syskallerna för Open File (13), Read from File (14) och Write to File (15) lägger nu tillbaka sitt returvärde till register v0 istället för a0. Tabellen i Datororganisation och Design s Bilaga B på SPIM anger a0 men SPIM använder sig konsekvent av v0 för returvärdena. Pseudo-instruktioner för div, divu, mulo, mulou, rem, remu, seq, sne, sge, sgeu, sgt, sgtu, sle, sleu accepterar nu en 16- eller 32-bitars omedelbar som deras tredje operand. Tidigare var det tredje operandet som skulle vara ett register. Befintliga verktyg testades med omkonfigurerat minnesadressutrymme (se första punkten). Gjorde några anpassningar till tangentbords - och bildsimulatorverktyget som låter det användas för Memory Mapped IO (MMIO), även under den kompakta minnesmodellen, där MMIO-basadressen är 0x00007f00 istället för 0xffff0000. Markering är inte perfekt i detta scenario. Bugg Fix: Syscall för Open File (13) reverserade betydelserna av termerna mode och flagga. Flaggor används för att ange den avsedda användningen av filen (lässkrivning). Läget används för att ställa in filbehörigheter i specifika situationer. MARS implementerar valda flaggor som stöds av Java-filströmmar och ignorerar läget om det anges. För mer information, se fliken Syscalls under Hjälp. Filexemplet på den fliken har rättats. Bugg Fix: Monteraren har felaktigt genererat ett fel på Hoppa-anvisningarna i kärntextsegmentet. Bugg Fix: Projektet (p) i kommandotgränssnittet fungerade felaktigt när MARS åberopades i katalogen som innehåller de filer som ska monteras. Bekräftelse: Utvecklingen av Release 3.7 stöddes av ett SIGCSE Special Projects Grant. What39s nya i MARS Version 3.6 Mars 3,6 släpptes i januari 2009. Förbättringar och buggfixar inkluderar: Weve genomförde slutligen den mest efterfrågade nya funktionen: minnes - och registerceller kommer att markeras när de skrivs till under tidsinställd eller stegvis simulering Den markerade minnesregistercellen representerar således resultatet av instruktionerna just avslutat. Under tidsbestämt eller stegat utförande är detta INTE den markerade instruktionen. Under backstapping är detta den markerade instruktionen. Den markerade instruktionen är nästa som ska utföras i normal (framåt) körningsföljd. I samband med cellhöjning har weve lagt till möjligheten att anpassa färgläggningsfärg och teckensnitt. Välj Markera i menyn Inställningar. I den resulterande dialogrutan kan du markera bakgrundsfärg, textfärg och teckensnitt för olika körtidstabeller (Textsegment, Datasegment, Register). Du kan också välja dem för normal, inte bara markerad, visa med jämn och ojämn rad men inte per tabell. Kall ny etikettfönster funktion: tabellen kan sorteras i antingen stigande eller nedåtgående ordning baserat på antingen etiketten (alfanumerisk) eller kolumnen Adress (numerisk). Klicka bara på kolumnrubriken för att välja och växla mellan stigande (upprätt triangel) eller nedåtgående (inverterad triangel). Adresser sorteras baserat på osignerade 32-bitars värden. Inställningen fortsätter över sessioner. Meddelandepanelen, som innehåller Mars-meddelandena och Kör IO-flikar, visas nu med en monoavstånd (fast teckenbredd). Detta underlättar textbaserad grafik när den körs från IDE. Mars. jar-distributionsfilen innehåller nu alla filer som behövs för att skapa en ny burkfil. Detta gör det enklare för dig att expandera burken, ändra källfiler, kompilera och producera en ny burk för lokal användning. CreatMarsJar. bat innehåller burkinstruktionen. Hjälpfönstret innehåller nu en flik för Bekräftelser. Detta erkänner MARS-bidragsgivare och korrespondenter. Weve lade till ett nytt systemsamtal (syscall) för att generera MIDI-toner synkront, syscall 33. Det ursprungliga MIDI-samtalet returneras omedelbart när tonen genereras. Den nya kommer inte att återgå till tonutmatningen är avslutad oavsett varaktighet. Datasegmentdisplayen rullar nu 8 rader (en halv tabell) istället för 16 när pilknapparna klickas. Detta gör det lättare att se en sekvens av relaterade celler som råkar korsa en tabellgräns. Observera att du kan hålla ner endera knappen för snabb bläddring. Kombinationsrutan med olika dataadressgränser fungerar också bättre nu. Bugg Fix: Två korrigeringar till tangentbords - och bildsimulatorverktyget. Den färdiga biten för sändaren återställdes inte baserat på instruktionsräkningen när den kördes i kärntextsegmentet, och statusregistren Exception Level bit testades inte innan den möjliggjorde avbrottstjänstrutinen (kan leda till loopning om avbrott inträffar vid avbrottstjänstrutinen). Tack till Michael Clancy och Carl Hauser för att få dem till min uppmärksamhet och föreslå lösningar. Bugg Fix: Stack segment byte adresser inte på ord gränser behandlades inte korrekt. Detta gäller för order för liten endian byte (big endian är inte aktiverad eller testad i MARS). Tack till Saul Spatz för att känna igen problemet och ge en patch. Mindre buggfixar inkluderar: Korrigering av fel som leder till fel vid start av MARS i kommandoläge, förtydligande monteringsfelmeddelande för för få eller för många operandfel och korrigering av beskrivningen av lhu och lbu-instruktioner från oanpassad till osignerad. What39s nya i MARS Version 3.5 Mars 3.5 släpptes den 24 juli 2008. Viktiga förbättringar och buggfixar inkluderar: Ett nytt verktyg, tangentbordet och skärmen MMIO Simulator, som stöder polling och avbrottsdrivna inmatnings - och utmatningsoperationer genom Memory-Mapped IO ( MMIO) minne. MIPS-programmet skriver till minnesplatser som fungerar som register för simulerade enheter. Stöder tangentbordsinmatning och en simulerad teckeninriktad display. Klicka på hjälpen för verktygsverktyget för mer information. Ett nytt verktyg, instruktionstjänsten, bidragit av MARS-användaren Felipe Lessa. Det räknar upp antalet MIPS-instruktioner som utförs tillsammans med procenttal för R-format, I-format och J-format instruktioner. Tack, Felipe Program-argument kan nu ges till MIPS-programmet vid körning, antingen genom en IDE-inställning eller kommandotillstånd. Se kommandot läge quotpaquot för mer information om kommandot läge. Argumentet (Argc) placeras i a0 och adressen till en rad nollställda strängar som innehåller argumenten (argv) placeras i a1. De är också tillgängliga på runtime stacken (sp). Två relaterade ändringar tillåter MARS att montera källkod som producerats av vissa kompilatorer som gcc. En förändring är att utfärda varningar snarare än fel för oigenkända direktiv. MARS genomför ett begränsat antal direktiv. Ignorera dessa varningar på din risk, men enheten kan fortsätta. Den andra ändringen är att tillåta att uttalandeiketter innehåller, och specifikt börjar med, 3939. I kommandoläge visas slutliga registervärden genom att ge registret namn som ett alternativ. Registrera namn börjar med 3939, vilket avlyssnas av vissa OS-kommandoskalor. Konventionen för att fly från den är inte enhetlig över skalen. Vi har förbättrat alternativen så nu kan du ge registret namn utan 3939. Till exempel kan du använda t0 istället för t0 som alternativ. Du kan inte referera till register på nummer på det här sättet, eftersom ett heltal alternativ tolkas av kommandoparseren som en gränsvärde för instruktionsutförande. Tack till Lucien Chaubert för att rapportera detta problem. Mindre förbättringar: Dumpfunktionen för kommandoläge har utökats för att tillåta minnesadressintervall samt segmentnamn. Om du anger en ny filtillägg i dialogrutan Öppna öppnas utvidgningen tillgänglig under hela den interaktiva sessionen. Datasegmentvärdesrepetitionsoperatören 39:39 arbetar nu för alla numeriska direktiv (.word half. Byte. Float. Double). Detta låter dig initiera flera på varandra följande minnesplatser till samma värde. Till exempel: dem. halva 1. 8 Spara värdet 1 i 8 på varandra följande halvord Major ändring: Hexadecimala konstanter som innehåller mindre än 8 siffror tolkas som om de ledande siffrorna är 039s. Till exempel kommer 0xFFFF att tolkas som 0x0000FFFF, inte 0xFFFFFFFF som tidigare. Detta orsakade problem med omedelbara operander inom intervallet 32768 till 65535, vilka felintolkades av de logiska operationerna som signerade 32-bitarsvärden snarare än osignerade 16-bitarsvärden. Signerade och osignerade 16-bitarsvärden kännetecknas nu av tokenizer baserat på prototypsymbolerna -100 för signerade och 100 för osignerade (huvudsakligen logiska operationer). Många tack till Eric Shade från Missouri State University och Greg Gibeling från UC Berkeley för deras utökade ansträngningar att hjälpa mig att ta itu med denna situation. Mindre buggfixar: round. w.s och round. w.d har ändrats för att korrekt utföra IEEE-avrundning som standard. Tack till Eric Shade för att peka ut det här. Syscall 12 (läs tecken) har ändrats för att lämna tecknet i v0 hellre än a0. Originalen var baserad på ett felutskrift i Bilaga A i Datororganisation och Design. MARS skulle inte utföras från den exekverbara Mars. jar-filen om den lagrades i en katalogväg som de katalognamnen innehåller några icke-ASCII-tecken. Detta har rättats. Tack till Felipe Lessa för att peka ut detta och erbjuda en lösning. MARS kommer nu korrekt att upptäcka EOF-läget när du läser från en fil med syscall 14. Tack till David Reimann för att vi ska uppmärksamma detta. What39s nya i MARS Version 3.4.1 Mars 3.4.1 släpptes den 23 januari 2008. Det är en buggfix release för att ta itu med två buggar. En bugg visas i pseudo-instruktioner där expansionen innehåller filialanvisningar. De fasta avgreningarna var inte längre korrekta på grund av förändringar i beräkningen av avräkningar i utgåva 3.4. Samtidigt tog vi upp frågan om att utöka sådana pseudoinstruktioner när fördröjd förgrening är aktiverad. Sådana expansioner kommer nu att innehålla en nop-instruktion som följer filialen. Vi tog också upp ett fel som uppstod vid generering av lui-instruktionen vid expansionen av villkorliga grenpseudoinstruktioner, vars andra operand är en 32 bitars omedelbar. Utvidgningarna för ett antal pseudoinstruktioner modifierades för att eliminera interna grenar. Dessa och andra utvidgningar optimerades också för teckenförlängd laddning av 16-bitars omedelbara operander genom att ersätta luiori - eller luisra-sekvensen med addi. Pseudo-instruktioner som påverkas av en eller båda dessa modifieringar inkluderar: abs, bleu, bgtu, beq, bne, seq, sge, sgeu, sle, sleu, sne, li, sub och subi. Dessa modifikationer föreslogs av Eric Shade från Missouri State University. Vad är nytt i MARS Version 3.4 En ny syscall (32) för att stödja pauser av specificerad längd i millisekunder (sömn) under simulerat utförande. Fem nya syscalls (40-44) för att stödja användningen av pseudoslumpa generatorer. Ett obegränsat antal av dessa generatorer är tillgängliga, var och en identifierad av ett heltal, och för var och en har du förmågan att: ställa in frövärdet, generera ett 32-bitars heltal från Java int-området, generera ett 32-bitars heltal mellan 0 (inklusive) och en angiven övre gräns (exklusiv), generera ett 32-bitars floatvärde mellan 0 (inklusive) och 1 (exklusivt) och generera ett 64-bitars dubbelvärde mellan 0 (inklusive) och 1 (exklusiv). Alla är baserade på java. util. Random-klassen. Tio nya syscalls (50-59) för att stödja meddelandedialogrutfönster och datainmatningsdialogrutor. Sistnämnda skiljer sig från standarddatainmatningssyramen genom att ett meddelande meddelande anges som ett syscall-argument och visas i inmatningsdialogrutan. Alla är baserade på klassen javax. swing. JOptionPane. Möjligheten att dumpa. text eller. data minneinnehåll till fil i olika format. Dumpningen kan utföras före eller efter programkörning från antingen IDE (Arkiv-menyn och verktygsfältet) eller från kommandoläge. Det kan också utföras under en exekveringspaus från IDE. Leta efter alternativet Dumpminne i menyn Arkiv eller alternativet dump i kommandoläge. En. text-dumpning innehåller bara platser som innehåller en instruktion. En. data-dumpning kommer att innehålla en multipel av 4KB-sidor som börjar vid segmentbasadressen och slutar med den sista 4KB-sidan som refereras av programmet. Nuvarande dumpformat inkluderar ren binär (java. io. PrintStream. write () - metod), hexadecimal text med ett ord (32 bitar) per rad och binär text med ett ord per rad. En gränssnitt, abstrakt klass och formatlaster har utvecklats för att underlätta utveckling och distribuering av ytterligare dumpformat. Denna förmåga prototyperades av Greg Gibeling från UC Berkeley. Ändrade beräkningen av gränsförskjutningar när fördröjd förgreningsinställning är inaktiverad. Branchinriktningsmåladresser representeras av det relativa antalet ord till filialen. Med Release 3.4 återspeglar detta värde fördröjd förgrening, oavsett om inställningen för fördröjd förgrening är aktiverad eller inte. Den genererade binära koden för filialer kommer nu att matcha exemplet i datorhandboken. Detta är en förändring från det förflutna, och gjordes efter omfattande diskussioner med flera MARS adopters. Tidigare var förskjutningsförskjutningen 1 lägre om inställningen för fördröjd förgrening var aktiverad - instruktionsetiketten: beq 0,0, etiketten skulle generera 0x1000FFFF om fördröjd förgrening var aktiverad och 0x10000000 om den var inaktiverad. Nu kommer det att generera 0x1000FFFF i båda fallen. Simulatorn kommer alltid att grena till rätt plats. MARS tillåter inte montering under en inställning och simulering under den andra. Buggfix: Den körbara JAR-filen Mars. jar kan nu köras från en annan arbetsmapp. Fix föreslogs av Zachary Kurmas av Grand Valley State University. Buggfix: Problemet med att MARS hänger under montering av en pseudo-instruktion med en etikettoperand som innehåller substringslaboratoriet har fixats. Buggfix: Ingen Swing-relaterad kod kommer att utföras när MARS körs i kommandoläge. Detta åtgärdar ett problem som uppstod när MARS kördes på ett huvudlöst system (ingen bildskärm). Swing är Java-biblioteket för att stödja programmering av grafiska användargränssnitt. Fix tillhandahölls av Greg Gibeling från UC Berkeley. 0-tecknet känns igen nu när det visas i strängbokstäver. What39s nya i MARS Version 3.3 Stöd för MIPS försenad förgrening. Alla MIPS-datorer implementerar detta men det kan vara förvirrande för programmerare, så det är inaktiverat som standard. Under fördröjd förgrening kommer nästa instruktion efter en gren - eller hoppinstruktion alltid att utföras, även om filialen eller hoppet tas. Många programmerare och montörer hanterar detta genom att införa en do-nothing quotnopquot-instruktion efter varje gren eller hoppa. MARS assembler lägger inte in en quotnopquot. Vissa pseudoinstruktioner utökas till en sekvens som innehåller en gren. Sådana instruktioner fungerar inte korrekt vid fördröjd förgrening. Fördröjd förgrening är tillgänglig i kommandot läge med quotdbquot-alternativet. Ett nytt verktyg av intresse främst till instruktörer. Skärmförstoringsverktyget, när det väljs från menyn Verktyg, kan användas för att producera en förstorad statisk bild av pixlarna som ligger under den. Bilden kan annoteras genom att dra musen över den för att producera en skrynkelinje. Den förstorar upp till 4 gånger original storlek. Du har nu möjlighet att ställa in och ändra textredigeraren typfamilj, stil och storlek. Välj quotEditor. citationstecken i menyn Inställningar för att få dialogrutan. Klicka på Apply-knappen om du vill se de nya inställningarna medan dialogrutan fortfarande är öppen. Teckensnittsinställningar behålls från en session till nästa. Fontfamiljslistan börjar med 6 teckensnitt som vanligtvis används över plattformar (valda från listor som hittades på codestyle. org), följt av en komplett lista. Två av de sex är monospaced typsnitt, två är proportionella serif, och två är proportionella sans serif. Fönstret Etiketter i rutan Execute, som visar symboltabellinformation, har förbättrats. När du klickar på ett etikettnamn eller dess adress centreras innehållet i den adressen och markeras i fönstret Text Segment eller Datasegment som lämpligt. Detta gör det lättare att ställa in brytpunkter baserat på textetiketter, eller för att hitta det värde som lagras på en etiketts adress. Om du omordnar kolumnerna i fönstret Text Segment genom att dra en kolumnrubrik kommer den nya beställningen att komma ihåg och tillämpas från den tiden framåt, även från en MARS-session till nästa. Fönstret Text Segment är där källkod, grundläggande kod, binär kod, kodadresser och brytpunkter visas. Om ett MIPS-program avslutas genom att kvittra av programmets bottomquot avslutas MARS, som tidigare, utan undantag, men nu visas ett mer beskrivande avslutningsmeddelande i fönstret Meddelanden. Tidigare var termineringsmeddelandet detsamma som det som genererades efter att ha exekverat en Exit syscall. Ett nytt systemsamtal (syscall) för att erhålla systemtiden är nu tillgänglig. Det är service 30 och finns inte i SPIM. Dess värde erhålls från metoden java. util. Date. getTime (). Se fliken Syscall i MIPS-hjälpen för mer information. Ett nytt systemsamtal (syscall) för att producera simulerat MIDI-ljud genom ditt ljudkort är nu tillgängligt. Det är service 31 och är inte tillgängligt i SPIM. Dess implementering baseras på paketet javax. sound. midi. Det har bara testats under Windows. Se fliken Syscall i MIPS-hjälpen för mer information. Vad är nytt i MARS Version 3.0 Sammanfattningsvis fixar mycket Version 3.0 en bugg från Version 2.2 (februari 2006) och lägger till ett antal instruktioner och funktioner. De grundläggande instruktionerna för SLTI och SLTIU var felaktigt kodade som R-format (register) istället för I-format (omedelbar) instruktioner. Detta korrigeras nu. Ytterligare MIPS-instruktioner Över 40 nya grundläggande instruktioner har lagts till MIPS-32 instruktionsuppsättningen som MARS nu monterar och simulerar. Totalt är nu 141 grundläggande instruktioner. Det stöder nu nästan alla instruktioner från Patterson och Hennessys datororganisation och design textbok. Undantag är fäll - och fällningsrelaterade instruktioner, och filialanvisningar som antar fördröjd förgrening (sannolikt). Ett stort antal pseudoinstruktioner tillsattes också. Alla pseudoinstruktioner från Appendix A i Patterson och Hennessys text är nu igenkända och utvidgade. Några andra tillsattes för enkelhets skull (ADDI med 32 bitars konstant) eller kul (SUBI). De flesta av pseudo-instruktionstilläggen implementerar emellertid alternativa minnesadresseringslägen för de olika belastnings - och butiksanvisningarna. Native MIPS-instruktioner för laddning och lagring stöder endast ett adresseringsläge: basadressering av blanketten 100 (1). där 100 är en 16 bit konstant och 1 är ett register vars innehåll läggs till konstanten för att bilda den effektiva adressen. MARS erkänner och expanderar nu följande adresseringslägen för alla last - och butikstransaktioner: register innehåll plus 0 offset-register innehåll plus summa av 32 bitars konstant och märkt adress En kommentar om 32 bitars konstanter. En pseudo-instruktion kan expandera annorlunda beroende på konstantens värde. Om den inte kan innehålla 16 bitar, läggs dess höga 16 bitar in i registeret (LUI) före bearbetningen. Vi har beslutat att konsekvent bestämma gränsen på 16 bitar baserat på signerade värden: -32768 till 32767. Andra simulatorer kan tolka värdena olika (t ex osignerade) beroende på vilket sammanhang de används i. Ny IDE har förmåga att gå bakåt genom simulerat MIPS-programexekvering, och ångra resultatet ett exekveringssteg åt gången. Symbolen på verktygsfältet är en vänsterpil med en 1, för att boka steg-ikonen med högerpekaren med 1. Den ångrar så många som de senaste 1000-exekveringsstegen. Eftersom varje backstep kräver ett klick eller knapptryckning, borde det vara gott om felsökningsändamål. Den är också tillgänglig vid normal eller abnorm programavslutning. En gräns: Den här funktionen kommer bara att ångra skriver till minnes-, register - eller flytpunkts-flaggor. SYSCALL-operationer till externa resurser (IO-konsolen, filer) försvinner inte av den här funktionen. Hjälpfunktionen har utökats och raffinerats något. MIPS-fliken innehåller nu fyra flikar: en lista över grundläggande instruktioner med beskrivningar, en lista över pseudoanvisningar och instruktionsformat med beskrivningar, en lista över monteringsdirektiv och dokumentation för alla tillgängliga SYSCALL-funktioner och deras användning. Och bara för skojs skull, har jag lagt till en flik som innehåller Walter Changs-texter till The MIPS Instruction Set som kan sjungas till en Gilbert och Sullivan melodi. På displayen Text Segment visas källan och motsvarande grundläggande uppgifter nu i angränsande kolumner istället för att vara sammanfogade i samma kolumn. Båda är fortfarande markerade när man gör en stegad eller tidsbestämd körning. En inställningsmeny har lagts till för att styra flera truefalsealternativ. De aktuella alternativen och deras standardvärden är: Visa fönstret Etiketter (symboltabell) på fliken Execute. Standardvärdet är false. Om markerat visas fönstret Etiketter till höger om textsegmentet. Tillåt program för att använda utökade (pseudo) instruktioner och format. Standardvärdet är sant. Detta inkluderar alla minnesadresseringslägen än MIPS-modellt läge (16 bitars konstant förskjutning som läggs till för att registrera innehåll). Montera en fil automatiskt så snart den öppnas och initiera dialogrutan Filöppnare med den nyligen öppnade filen. Standardvärdet är false. Det här är praktiskt om du använder en extern redaktör för att komponera dina program. Visa minnesadresser i hexadecimal. Standardvärdet är sant. Om avmarkerad visas adresser i decimal. Den här inställningen kan också väljas i en kryssruta på gränsen för datasegmentfönstret. Visa minne och registrera innehåll i hexadecimal. Standardvärdet är sant. Om avmarkerad visas vlaues i decimal. Den här inställningen kan också väljas i en kryssruta på gränsen för datasegmentfönstret. Ett menyalternativ Radera alla brytpunkter har lagts till i menyn Kör. It is enabled whenever one or more execution breakpoints have been set. Much more convenient than having to clear them individually. They can be cleared before, during, or after execution. Note that all breakpoints are automatically cleared each time a file is assembled. New toolbar and menu item icons. New Command Line features A new command switch, np , specifies that a MIPS program is not permitted to use pseudo instructions andor formats.3.18.26 MIPS Options Generate big-endian code. Generate little-endian code. This is the default for lsquo mipsel-- rsquo configurations. Generate code that runs on arch. which can be the name of a generic MIPS ISA, or the name of a particular processor. The ISA names are: lsquo mips1 rsquo, lsquo mips2 rsquo, lsquo mips3 rsquo, lsquo mips4 rsquo, lsquo mips32 rsquo, lsquo mips32r2 rsquo, lsquo mips32r3 rsquo, lsquo mips32r5 rsquo, lsquo mips32r6 rsquo, lsquo mips64 rsquo, lsquo mips64r2 rsquo, lsquo mips64r3 rsquo, lsquo mips64r5 rsquo and lsquo mips64r6 rsquo. The processor names are: lsquo 4kc rsquo, lsquo 4km rsquo, lsquo 4kp rsquo, lsquo 4ksc rsquo, lsquo 4kec rsquo, lsquo 4kem rsquo, lsquo 4kep rsquo, lsquo 4ksd rsquo, lsquo 5kc rsquo, lsquo 5kf rsquo, lsquo 20kc rsquo, lsquo 24kc rsquo, lsquo 24kf21 rsquo, lsquo 24kf11 rsquo, lsquo 24kec rsquo, lsquo 24kef21 rsquo, lsquo 24kef11 rsquo, lsquo 34kc rsquo, lsquo 34kf21 rsquo, lsquo 34kf11 rsquo, lsquo 34kn rsquo, lsquo 74kc rsquo, lsquo 74kf21 rsquo, lsquo 74kf11 rsquo, lsquo 74kf32 rsquo, lsquo 1004kc rsquo, lsquo 1004kf21 rsquo, lsquo 1004kf11 rsquo, lsquo i6400 rsquo, lsquo interaptiv rsquo, lsquo loongson2e rsquo, lsquo loongson2f rsquo, lsquo loongson3a rsquo, lsquo m4k rsquo, lsquo m14k rsquo, lsquo m14kc rsquo, lsquo m14ke rsquo, lsquo m14kec rsquo, lsquo m5100 rsquo, lsquo m5101 rsquo, lsquo octeon rsquo, lsquo octeon rsquo, lsquo octeon2 rsquo, lsquo octeon3 rsquo, lsquo orion rsquo, lsquo p5600 rsquo, lsquo r2000 rsquo, lsquo r3000 rsquo, lsquo r3900 rsquo, lsquo r4000 rsquo, lsq uo r4400 rsquo, lsquo r4600 rsquo, lsquo r4650 rsquo, lsquo r4700 rsquo, lsquo r6000 rsquo, lsquo r8000 rsquo, lsquo rm7000 rsquo, lsquo rm9000 rsquo, lsquo r10000 rsquo, lsquo r12000 rsquo, lsquo r14000 rsquo, lsquo r16000 rsquo, lsquo sb1 rsquo, lsquo sr71000 rsquo, lsquo vr4100 rsquo, lsquo vr4111 rsquo, lsquo vr4120 rsquo, lsquo vr4130 rsquo, lsquo vr4300 rsquo, lsquo vr5000 rsquo, lsquo vr5400 rsquo, lsquo vr5500 rsquo, lsquo xlr rsquo and lsquo xlp rsquo. The special value lsquo from-abi rsquo selects the most compatible architecture for the selected ABI (that is, lsquo mips1 rsquo for 32-bit ABIs and lsquo mips3 rsquo for 64-bit ABIs). The native LinuxGNU toolchain also supports the value lsquo native rsquo, which selects the best architecture option for the host processor. - marchnative has no effect if GCC does not recognize the processor. In processor names, a final lsquo 000 rsquo can be abbreviated as lsquo k rsquo (for example, - marchr2k ). Prefixes are optional, and lsquo vr rsquo may be written lsquo r rsquo. Names of the form lsquo n f21 rsquo refer to processors with FPUs clocked at half the rate of the core, names of the form lsquo n f11 rsquo refer to processors with FPUs clocked at the same rate as the core, and names of the form lsquo n f32 rsquo refer to processors with FPUs clocked a ratio of 3:2 with respect to the core. For compatibility reasons, lsquo n f rsquo is accepted as a synonym for lsquo n f21 rsquo while lsquo n x rsquo and lsquo b fx rsquo are accepted as synonyms for lsquo n f11 rsquo. GCC defines two macros based on the value of this option. The first is MIPSARCH. which gives the name of target architecture, as a string. The second has the form MIPSARCH foo. where foo is the capitalized value of MIPSARCH. For example, - marchr2000 sets MIPSARCH to quotr2000quot and defines the macro MIPSARCHR2000. Note that the MIPSARCH macro uses the processor names given above. In other words, it has the full prefix and does not abbreviate lsquo 000 rsquo as lsquo k rsquo. In the case of lsquo from-abi rsquo, the macro names the resolved architecture (either quotmips1quot or quotmips3quot ). It names the default architecture when no - march option is given. Optimize for arch. Among other things, this option controls the way instructions are scheduled, and the perceived cost of arithmetic operations. The list of arch values is the same as for - march. When this option is not used, GCC optimizes for the processor specified by - march. By using - march and - mtune together, it is possible to generate code that runs on a family of processors, but optimize the code for one particular member of that family. - mtune defines the macros MIPSTUNE and MIPSTUNE foo. which work in the same way as the - march ones described above. Equivalent to - marchmips1. Equivalent to - marchmips2. Equivalent to - marchmips3. Equivalent to - marchmips64r5. Equivalent to - marchmips64r6. Generate (do not generate) MIPS16 code. If GCC is targeting a MIPS32 or MIPS64 architecture, it makes use of the MIPS16e ASE. MIPS16 code generation can also be controlled on a per-function basis by means of mips16 and nomips16 attributes. See Function Attributes. för mer information. Generate MIPS16 code on alternating functions. This option is provided for regression testing of mixed MIPS16non-MIPS16 code generation, and is not intended for ordinary use in compiling user code. Require (do not require) that code using the standard (uncompressed) MIPS ISA be link-compatible with MIPS16 and microMIPS code, and vice versa. For example, code using the standard ISA encoding cannot jump directly to MIPS16 or microMIPS code it must either use a call or an indirect jump. - minterlink-compressed therefore disables direct jumps unless GCC knows that the target of the jump is not compressed. Aliases of - minterlink-compressed and - mno-interlink-compressed. These options predate the microMIPS ASE and are retained for backwards compatibility. Generate code for the given ABI. Note that the EABI has a 32-bit and a 64-bit variant. GCC normally generates 64-bit code when you select a 64-bit architecture, but you can use - mgp32 to get 32-bit code instead. GCC supports a variant of the o32 ABI in which floating-point registers are 64 rather than 32 bits wide. You can select this combination with - mabi32 - mfp64. This ABI relies on the mthc1 and mfhc1 instructions and is therefore only supported for MIPS32R2, MIPS32R3 and MIPS32R5 processors. The register assignments for arguments and return values remain the same, but each scalar value is passed in a single 64-bit register rather than a pair of 32-bit registers. For example, scalar floating-point values are returned in lsquo f0 rsquo only, not a lsquo f0 rsquolsquo f1 rsquo pair. The set of call-saved registers also remains the same in that the even-numbered double-precision registers are saved. Two additional variants of the o32 ABI are supported to enable a transition from 32-bit to 64-bit registers. These are FPXX ( - mfpxx ) and FP64A ( - mfp64 - mno-odd-spreg ). The FPXX extension mandates that all code must execute correctly when run using 32-bit or 64-bit registers. The code can be interlinked with either FP32 or FP64, but not both. The FP64A extension is similar to the FP64 extension but forbids the use of odd-numbered single-precision registers. This can be used in conjunction with the FRE mode of FPUs in MIPS32R5 processors and allows both FP32 and FP64A code to interlink and run in the same process without changing FPU modes. Generate (do not generate) code that is suitable for SVR4-style dynamic objects. - mabicalls is the default for SVR4-based systems. Generate (do not generate) code that is fully position-independent, and that can therefore be linked into shared libraries. This option only affects - mabicalls. All - mabicalls code has traditionally been position-independent, regardless of options like - fPIC and - fpic. However, as an extension, the GNU toolchain allows executables to use absolute accesses for locally-binding symbols. It can also use shorter GP initialization sequences and generate direct calls to locally-defined functions. This mode is selected by - mno-shared. - mno-shared depends on binutils 2.16 or higher and generates objects that can only be linked by the GNU linker. However, the option does not affect the ABI of the final executable it only affects the ABI of relocatable objects. Using - mno-shared generally makes executables both smaller and quicker. - mshared is the default. Assume (do not assume) that the static and dynamic linkers support PLTs and copy relocations. This option only affects - mno-shared - mabicalls. For the n64 ABI, this option has no effect without - msym32. You can make - mplt the default by configuring GCC with --with-mips-plt. The default is - mno-plt otherwise. Lift (do not lift) the usual restrictions on the size of the global offset table. GCC normally uses a single instruction to load values from the GOT. While this is relatively efficient, it only works if the GOT is smaller than about 64k. Anything larger causes the linker to report an error such as: If this happens, you should recompile your code with - mxgot. This works with very large GOTs, although the code is also less efficient, since it takes three instructions to fetch the value of a global symbol. Note that some linkers can create multiple GOTs. If you have such a linker, you should only need to use - mxgot when a single object file accesses more than 64krsquos worth of GOT entries. Very few do. These options have no effect unless GCC is generating position independent code. Assume that general-purpose registers are 32 bits wide. Assume that general-purpose registers are 64 bits wide. Assume that floating-point registers are 32 bits wide. Assume that floating-point registers are 64 bits wide. Do not assume the width of floating-point registers. Use floating-point coprocessor instructions. Do not use floating-point coprocessor instructions. Implement floating-point calculations using library calls instead. Equivalent to - msoft-float. but additionally asserts that the program being compiled does not perform any floating-point operations. This option is presently supported only by some bare-metal MIPS configurations, where it may select a special set of libraries that lack all floating-point support (including, for example, the floating-point printf formats). If code compiled with - mno-float accidentally contains floating-point operations, it is likely to suffer a link-time or run-time failure. Assume that the floating-point coprocessor only supports single-precision operations. Assume that the floating-point coprocessor supports double-precision operations. Detta är standardvärdet. Enable the use of odd-numbered single-precision floating-point registers for the o32 ABI. This is the default for processors that are known to support these registers. When using the o32 FPXX ABI, - mno-odd-spreg is set by default. These options control the treatment of the special not-a-number (NaN) IEEE 754 floating-point data with the abs. fmt and neg. fmt machine instructions. By default or when - mabslegacy is used the legacy treatment is selected. In this case these instructions are considered arithmetic and avoided where correct operation is required and the input operand might be a NaN. A longer sequence of instructions that manipulate the sign bit of floating-point datum manually is used instead unless the - ffinite-math-only option has also been specified. The - mabs2008 option selects the IEEE 754-2008 treatment. In this case these instructions are considered non-arithmetic and therefore operating correctly in all cases, including in particular where the input operand is a NaN. These instructions are therefore always used for the respective operations. These options control the encoding of the special not-a-number (NaN) IEEE 754 floating-point data. The - mnanlegacy option selects the legacy encoding. In this case quiet NaNs (qNaNs) are denoted by the first bit of their trailing significand field being 0, whereas signaling NaNs (sNaNs) are denoted by the first bit of their trailing significand field being 1. The - mnan2008 option selects the IEEE 754-2008 encoding. In this case qNaNs are denoted by the first bit of their trailing significand field being 1, whereas sNaNs are denoted by the first bit of their trailing significand field being 0. The default is - mnanlegacy unless GCC has been configured with --with-nan2008. Use (do not use) lsquo ll rsquo, lsquo sc rsquo, and lsquo sync rsquo instructions to implement atomic memory built-in functions. When neither option is specified, GCC uses the instructions if the target architecture supports them. - mllsc is useful if the runtime environment can emulate the instructions and - mno-llsc can be useful when compiling for nonstandard ISAs. You can make either option the default by configuring GCC with --with-llsc and --without-llsc respectively. --with-llsc is the default for some configurations see the installation documentation for details. Use (do not use) revision 1 of the MIPS DSP ASE. See MIPS DSP Built-in Functions. This option defines the preprocessor macro mipsdsp. It also defines mipsdsprev to 1. Use (do not use) revision 2 of the MIPS DSP ASE. See MIPS DSP Built-in Functions. This option defines the preprocessor macros mipsdsp and mipsdspr2. It also defines mipsdsprev to 2. Use (do not use) the MIPS SmartMIPS ASE. Use (do not use) paired-single floating-point instructions. See MIPS Paired-Single Support. This option requires hardware floating-point support to be enabled. Use (do not use) MIPS Digital Media Extension instructions. This option can only be used when generating 64-bit code and requires hardware floating-point support to be enabled. Use (do not use) the MIPS-3D ASE. See MIPS-3D Built-in Functions. The option - mips3d implies - mpaired-single. Generate (do not generate) microMIPS code. MicroMIPS code generation can also be controlled on a per-function basis by means of micromips and nomicromips attributes. See Function Attributes. för mer information. Use (do not use) MT Multithreading instructions. Use (do not use) the MIPS MCU ASE instructions. Use (do not use) the MIPS Enhanced Virtual Addressing instructions. Use (do not use) the MIPS Virtualization Application Specific instructions. Use (do not use) the MIPS eXtended Physical Address (XPA) instructions. Force long types to be 64 bits wide. See - mlong32 for an explanation of the default and the way that the pointer size is determined. Force long. int. and pointer types to be 32 bits wide. The default size of int s, long s and pointers depends on the ABI. All the supported ABIs use 32-bit int s. The n64 ABI uses 64-bit long s, as does the 64-bit EABI the others use 32-bit long s. Pointers are the same size as long s, or the same size as integer registers, whichever is smaller. Assume (do not assume) that all symbols have 32-bit values, regardless of the selected ABI. This option is useful in combination with - mabi64 and - mno-abicalls because it allows GCC to generate shorter and faster references to symbolic addresses. Put definitions of externally-visible data in a small data section if that data is no bigger than num bytes. GCC can then generate more efficient accesses to the data see - mgpopt for details. The default - G option depends on the configuration. Extend (do not extend) the - G behavior to local data too, such as to static variables in C. - mlocal-sdata is the default for all configurations. If the linker complains that an application is using too much small data, you might want to try rebuilding the less performance-critical parts with - mno-local-sdata. You might also want to build large libraries with - mno-local-sdata. so that the libraries leave more room for the main program. Assume (do not assume) that externally-defined data is in a small data section if the size of that data is within the - G limit. - mextern-sdata is the default for all configurations. If you compile a module Mod with - mextern-sdata - G num - mgpopt. and Mod references a variable Var that is no bigger than num bytes, you must make sure that Var is placed in a small data section. If Var is defined by another module, you must either compile that module with a high-enough - G setting or attach a section attribute to Var rsquos definition. If Var is common, you must link the application with a high-enough - G setting. The easiest way of satisfying these restrictions is to compile and link every module with the same - G option. However, you may wish to build a library that supports several different small data limits. You can do this by compiling the library with the highest supported - G setting and additionally using - mno-extern-sdata to stop the library from making assumptions about externally-defined data. Use (do not use) GP-relative accesses for symbols that are known to be in a small data section see - G. - mlocal-sdata and - mextern-sdata. - mgpopt is the default for all configurations. - mno-gpopt is useful for cases where the gp register might not hold the value of gp. For example, if the code is part of a library that might be used in a boot monitor, programs that call boot monitor routines pass an unknown value in gp. (In such situations, the boot monitor itself is usually compiled with - G0 .) - mno-gpopt implies - mno-local-sdata and - mno-extern-sdata. Allocate variables to the read-only data section first if possible, then next in the small data section if possible, otherwise in data. This gives slightly slower code than the default, but reduces the amount of RAM required when executing, and thus may be preferred for some embedded systems. Put uninitialized const variables in the read-only data section. This option is only meaningful in conjunction with - membedded-data. Specify whether GCC may generate code that reads from executable sections. There are three possible settings: Instructions may freely access executable sections. This is the default setting. MIPS16 PC-relative load instructions can access executable sections, but other instructions must not do so. This option is useful on 4KSc and 4KSd processors when the code TLBs have the Read Inhibit bit set. It is also useful on processors that can be configured to have a dual instructiondata SRAM interface and that, like the M4K, automatically redirect PC-relative loads to the instruction RAM. Instructions must not access executable sections. This option can be useful on targets that are configured to have a dual instructiondata SRAM interface but that (unlike the M4K) do not automatically redirect PC-relative loads to the instruction RAM. Enable (disable) use of the hi() and lo() assembler relocation operators. This option has been superseded by - mexplicit-relocs but is retained for backwards compatibility. Use (do not use) assembler relocation operators when dealing with symbolic addresses. The alternative, selected by - mno-explicit-relocs. is to use assembler macros instead. - mexplicit-relocs is the default if GCC was configured to use an assembler that supports relocation operators. Trap (do not trap) on integer division by zero. The default is - mcheck-zero-division. MIPS systems check for division by zero by generating either a conditional trap or a break instruction. Using traps results in smaller code, but is only supported on MIPS II and later. Also, some versions of the Linux kernel have a bug that prevents trap from generating the proper signal ( SIGFPE ). Use - mdivide-traps to allow conditional traps on architectures that support them and - mdivide-breaks to force the use of breaks. The default is usually - mdivide-traps. but this can be overridden at configure time using --with-dividebreaks. Divide-by-zero checks can be completely disabled using - mno-check-zero-division. Enable (disable) an optimization that pairs consecutive load or store instructions to enable loadstore bonding. This option is enabled by default but only takes effect when the selected architecture is known to support bonding. Force (do not force) the use of memcpy for non-trivial block moves. The default is - mno-memcpy. which allows GCC to inline most constant-sized copies. Disable (do not disable) use of the jal instruction. Calling functions using jal is more efficient but requires the caller and callee to be in the same 256 megabyte segment. This option has no effect on abicalls code. The default is - mno-long-calls. Enable (disable) use of the mad. madu and mul instructions, as provided by the R4650 ISA. Enable (disable) use of the madd and msub integer instructions. The default is - mimadd on architectures that support madd and msub except for the 74k architecture where it was found to generate slower code. Enable (disable) use of the floating-point multiply-accumulate instructions, when they are available. The default is - mfused-madd. On the R8000 CPU when multiply-accumulate instructions are used, the intermediate product is calculated to infinite precision and is not subject to the FCSR Flush to Zero bit. This may be undesirable in some circumstances. On other processors the result is numerically identical to the equivalent computation using separate multiply, add, subtract and negate instructions. Tell the MIPS assembler to not run its preprocessor over user assembler files (with a lsquo. s rsquo suffix) when assembling them. Work around the 24K E48 (lost data on stores during refill) errata. The workarounds are implemented by the assembler rather than by GCC. Work around certain R4000 CPU errata: - A double-word or a variable shift may give an incorrect result if executed immediately after starting an integer division. - A double-word or a variable shift may give an incorrect result if executed while an integer multiplication is in progress. - An integer division may give an incorrect result if started in a delay slot of a taken branch or a jump. - mfix-r4400 - mno-fix-r4400Work around certain R4400 CPU errata: - A double-word or a variable shift may give an incorrect result if executed immediately after starting an integer division. - mfix-r10000 - mno-fix-r10000Work around certain R10000 errata: - ll sc sequences may not behave atomically on revisions prior to 3.0. They may deadlock on revisions 2.6 and earlier. This option can only be used if the target architecture supports branch-likely instructions. - mfix-r10000 is the default when - marchr10000 is used - mno-fix-r10000 is the default otherwise. Work around the RM7000 dmult dmultu errata. The workarounds are implemented by the assembler rather than by GCC. Work around certain VR4120 errata: - dmultu does not always produce the correct result. - div and ddiv do not always produce the correct result if one of the operands is negative. The workarounds for the division errata rely on special functions in libgcc. a. At present, these functions are only provided by the mips64vr-elf configurations. Other VR4120 errata require a NOP to be inserted between certain pairs of instructions. These errata are handled by the assembler, not by GCC itself. Work around the VR4130 mflo mfhi errata. The workarounds are implemented by the assembler rather than by GCC, although GCC avoids using mflo and mfhi if the VR4130 macc. macchi. dmacc and dmacchi instructions are available instead. Work around certain SB-1 CPU core errata. (This flag currently works around the SB-1 revision 2 ldquoF1rdquo and ldquoF2rdquo floating-point errata.) Specify whether GCC should insert cache barriers to avoid the side-effects of speculation on R10K processors. In common with many processors, the R10K tries to predict the outcome of a conditional branch and speculatively executes instructions from the ldquotakenrdquo branch. It later aborts these instructions if the predicted outcome is wrong. However, on the R10K, even aborted instructions can have side effects. This problem only affects kernel stores and, depending on the system, kernel loads. As an example, a speculatively-executed store may load the target memory into cache and mark the cache line as dirty, even if the store itself is later aborted. If a DMA operation writes to the same area of memory before the ldquodirtyrdquo line is flushed, the cached data overwrites the DMA-ed data. See the R10K processor manual for a full description, including other potential problems. One workaround is to insert cache barrier instructions before every memory access that might be speculatively executed and that might have side effects even if aborted. - mr10k-cache-barrier setting controls GCCrsquos implementation of this workaround. It assumes that aborted accesses to any byte in the following regions does not have side effects: the memory occupied by the current functionrsquos stack frame the memory occupied by an incoming stack argument the memory occupied by an object with a link-time-constant address. It is the kernelrsquos responsibility to ensure that speculative accesses to these regions are indeed safe. If the input program contains a function declaration such as: then the implementation of foo must allow j foo and jal foo to be executed speculatively. GCC honors this restriction for functions it compiles itself. It expects non-GCC functions (such as hand-written assembly code) to do the same. The option has three forms: Insert a cache barrier before a load or store that might be speculatively executed and that might have side effects even if aborted. Insert a cache barrier before a store that might be speculatively executed and that might have side effects even if aborted. Disable the insertion of cache barriers. This is the default setting. - mflush-func func - mno-flush-func Specifies the function to call to flush the I and D caches, or to not call any such function. If called, the function must take the same arguments as the common flushfunc. that is, the address of the memory range for which the cache is being flushed, the size of the memory range, and the number 3 (to flush both caches). The default depends on the target GCC was configured for, but commonly is either flushfunc or cpuflush. Set the cost of branches to roughly num ldquosimplerdquo instructions. This cost is only a heuristic and is not guaranteed to produce consistent results across releases. A zero cost redundantly selects the default, which is based on the - mtune setting. Enable or disable use of Branch Likely instructions, regardless of the default for the selected architecture. By default, Branch Likely instructions may be generated if they are supported by the selected architecture. An exception is for the MIPS32 and MIPS64 architectures and processors that implement those architectures for those, Branch Likely instructions are not be generated by default because the MIPS32 and MIPS64 architectures specifically deprecate their use. - mcompact-branchesnever - mcompact-branchesoptimal - mcompact-branchesalways These options control which form of branches will be generated. The default is - mcompact-branchesoptimal. The - mcompact-branchesnever option ensures that compact branch instructions will never be generated. The - mcompact-branchesalways option ensures that a compact branch instruction will be generated if available. If a compact branch instruction is not available, a delay slot form of the branch will be used instead. This option is supported from MIPS Release 6 onwards. The - mcompact-branchesoptimal option will cause a delay slot branch to be used if one is available in the current ISA and the delay slot is successfully filled. If the delay slot is not filled, a compact branch will be chosen if one is available. Specifies whether FP exceptions are enabled. This affects how FP instructions are scheduled for some processors. The default is that FP exceptions are enabled. For instance, on the SB-1, if FP exceptions are disabled, and we are emitting 64-bit code, then we can use both FP pipes. Otherwise, we can only use one FP pipe. The VR4130 pipeline is two-way superscalar, but can only issue two instructions together if the first one is 8-byte aligned. When this option is enabled, GCC aligns pairs of instructions that it thinks should execute in parallel. This option only has an effect when optimizing for the VR4130. It normally makes code faster, but at the expense of making it bigger. It is enabled by default at optimization level - O3. Enable (disable) generation of synci instructions on architectures that support it. The synci instructions (if enabled) are generated when builtinclearcache is compiled. This option defaults to - mno-synci. but the default can be overridden by configuring GCC with --with-synci. When compiling code for single processor systems, it is generally safe to use synci. However, on many multi-core (SMP) systems, it does not invalidate the instruction caches on all cores and may lead to undefined behavior. Try to turn PIC calls that are normally dispatched via register 25 into direct calls. This is only possible if the linker can resolve the destination at link time and if the destination is within range for a direct call. - mrelax-pic-calls is the default if GCC was configured to use an assembler and a linker that support the. reloc assembly directive and - mexplicit-relocs is in effect. With - mno-explicit-relocs. this optimization can be performed by the assembler and the linker alone without help from the compiler. Emit (do not emit) code that allows mcount to modify the calling functionrsquos return address. When enabled, this option extends the usual mcount interface with a new ra-address parameter, which has type intptrt and is passed in register 12. mcount can then modify the return address by doing both of the following: Returning the new address in register 31. Storing the new address in ra-address. if ra-address is nonnull. The default is - mno-mcount-ra-address. Enable (disable) frame header optimization in the o32 ABI. When using the o32 ABI, calling functions will allocate 16 bytes on the stack for the called function to write out register arguments. When enabled, this optimization will suppress the allocation of the frame header if it can be determined that it is unused. This optimization is off by default at all optimization levels. When applicable, enable (disable) the generation of lwxc1. swxc1. ldxc1. sdxc1 instructions. Enabled by default. When applicable, enable (disable) the generation of 4-operand madd. s. madd. d and related instructions. Enabled by default.
Comments
Post a Comment