Econometriegegevens bekijken in STATA

Door Roberto Peace

Voordat u begint met econometrische analyse, moet u ervoor zorgen dat u bekend bent met uw gegevens en hoe u deze kunt bekijken in de populaire STATA-software. Een econometrisch model wil je immers niet schatten met data die veelal onvolledig of vol fouten zijn.



In versie 12.1 van STATA kunt u met de standaardinstelling een dataset openen die zo groot is als 64 megabyte (MB) en maximaal 5.000 variabelen bevat. Als uw dataset groter is dan 64 MB, moet u het aan STATA toegewezen geheugen vergroten door set memory #m op de opdrachtregel te typen, waarbij # de grootte van uw dataset in MB is.



Evenzo, als uw dataset meer dan 5.000 variabelen bevat, moet u set maxvar # typen op de opdrachtregel, waarbij # het aantal variabelen in uw dataset is.

neulasta bijwerkingen op lange termijn

De Gegevens tab in de menubalk bevat de meeste elementen die je nodig hebt om kennis te maken met je gegevens. Na het openen van een STATA-dataset gebruik je regelmatig de volgende commando's:



  • Selecteer Gegevens → Gegevens beschrijven → Gegevens in het geheugen beschrijven of typ beschrijf op de opdrachtregel en druk op return: STATA laat je zien hoeveel observaties en variabelen de dataset bevat. Bovendien worden de namen en typen (numeriek of tekenreeks) van alle variabelen vermeld.

  • Selecteer Gegevens → Gegevens beschrijven → Samenvattende statistieken of typ samenvatten op de opdrachtregel en druk op return: Met deze opdracht biedt STATA u beschrijvende basismaten voor alle numerieke variabelen in uw dataset. U krijgt met name het aantal waarnemingen met niet-ontbrekende waarden, gemiddelde, standaarddeviatie, minimumwaarde en maximumwaarde voor elke variabele.

    De tekenreeksvariabelen bevatten letters, namen of woordgroepen, dus er kan geen gemiddelde of standaarddeviatie voor worden berekend.



In de afbeelding worden de commando's beschrijven en samenvatten gebruikt om de fundamentele kenmerken van de dataset te bekijken.

afbeelding0.jpg

De Gegevens tab of beschrijf en vat de commando's samen, bieden de basisinformatie die u gebruikt voor uw econometrische analyse. Bestudeer de tabellen met de beschrijvende informatie en zorg ervoor dat alle waarden logisch zijn. Met andere woorden, zorg ervoor dat de minimum-, maximum- en gemiddelde waarden haalbaar zijn voor elke variabele in uw dataset.

U kunt ook af en toe het list-commando gebruiken, maar wees er voorzichtig mee omdat het de waarde voor elke variabele en elke waarneming weergeeft. Met andere woorden, het geeft de volledige dataset weer. Met een grote dataset (duizenden waarnemingen en tientallen variabelen), zal deze lijst u waarschijnlijk niet helpen bij het vinden van fouten, tenzij u de lijst verfijnt tot een specifieke waarneming met behulp van een if-statement of door subscripting.

Houd er rekening mee dat het resultatengedeelte van STATA standaard ongeveer één pagina met uitvoer weergeeft. STATA vraagt ​​u dan met het -meer- bericht. Als u op de return-toets drukt, ziet u een extra uitvoerregel en als u op de spatiebalk drukt, wordt een andere uitvoerpagina weergegeven. Als u niet wilt dat STATA pauzeert voor -meer- berichten, typt u set more off op de opdrachtregel. De daaropvolgende uitvoer wordt dan in zijn geheel weergegeven.