Statistische SPSS-vraag

 
Plaats nieuw bericht   Plaats reactie    Bona's forum index // Discussie
Vorige onderwerp :: Volgende onderwerp  
Auteur Bericht
Maarten



Geregistreerd op: 23-4-2005
Berichten: 2055
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 11:39 am    Onderwerp: Statistische SPSS-vraag Reageer met quote
Reinier vroeg zich af wannneer Drs. Berg verandert in Dr. Berg. Welnu, er is nog een klein puntje wat dat in de weg staat.

Wanneer Reinier, Julius, Jona, Thomas, Adrian of wie dan ook met kennis van statistiek (in combinatie met SPSS) antwoord kent op onderstaande vraag, of mij in contact kan brengen met iemand, dan is mijn dank groot!

Het probleem:

Ik zet twee metrische variabelen (een onafhankele en een afhankelijke) tegen elkaar uit. Er is een positieve (lineaire) samenhang. Een correlatiecoefficient van ongeveer r = +0.40

Ik vergelijk echter de lineaire samenhang met de logaritmische samenhang en de kwadratische samenhang.

In SPSS is dat erg eenvoudig. We doen Analyze --> Regression --> Curve Estimation. We voeren nu de afhankelijke en de onafhankelijke variabele in. En onder 'Models' vinken we niet alleen linear aan (de default), maar ook logaritmic en quadratic.

In de output krijgen we nu voor elk van de drie pasvormen ('fits') de R-kwadraat (verklaarde variantie). Bij de kwadratische passing is de verklaarde variantie altijd het best, vanwege het feit dat er een vrijheidsgraad minder is. Dat kan dus geen reden zijn om een kwadratische passing aan te nemen.

Wat ik wil doen is toetsen of de niet-lineaire passing significant beter is dan de lineaire fit. En dan uiteraard ook of de logaritmische passing of de kwadratische passing van toepassing is.

Ik heb in dit verband wel eens de term 'Toets voor verandering R-kwadraat'. Dit zou gewoon een simpele F-toets moeten zijn? Maar volgens mij kan dit niet in SPSS. Weet iemand hoe dit moet? Kan het in SPSS? En zo nee, kun je je SPSS-datafile simpel omzetten in data die geschikt zijn voor een statistisch programma die dit wel doet?

Als jullie een antwoord hebben of iemand kennen die dit kan oplossen (redelijke betaling is geen probleem), dan hoor ik het graag.
_________________
Reason - Individualism - Capitalism
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Bekijk de homepage
anne



Geregistreerd op: 26-4-2005
Berichten: 1688

BerichtGeplaatst: Wo Mrt 03, 2010 11:56 am    Onderwerp: Reageer met quote
zijn hier geen boeken voor? er staan bij mij in de kast boeken met titels als multivariate statistics for the social sciences (en ondertitels als in SPSS, en nog twee andere programma's)
_________________
Amsterdam EUDC 2010: 12-17 juli.
http://www.amsterdameudc.org
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Verstuur e-mail
Micha



Geregistreerd op: 25-9-2009
Berichten: 93
Woonplaats: Londen

BerichtGeplaatst: Wo Mrt 03, 2010 12:17 pm    Onderwerp: Reageer met quote
Ik heb altijd geleerd dit te doen door middel van Block 1, Block 2, Block 3 ... in Analyze-Regression-Linear.

Waarbij Block 1 alleen de lineare onafhankelijke variabele bevat en Block 2 bijvoorbeeld (onafhankelijke variabele)^2 toevoegt.
Naar boven
Bekijk gebruikers profiel Stuur privé bericht
Maarten



Geregistreerd op: 23-4-2005
Berichten: 2055
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 1:19 pm    Onderwerp: Reageer met quote
anne schreef:
zijn hier geen boeken voor? er staan bij mij in de kast boeken met titels als multivariate statistics for the social sciences (en ondertitels als in SPSS, en nog twee andere programma's)


@Anne: ik heb uiteraard mijn boeken en internet uitvoerig afgespeurd, maar deze (ogenschijnlijk vrij simpele vraag) niet weten te vinden.
_________________
Reason - Individualism - Capitalism
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Bekijk de homepage
JPL



Geregistreerd op: 23-4-2005
Berichten: 2081
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 1:22 pm    Onderwerp: Reageer met quote
Mijn eerste reactie na het lezen van de vraag is dezelfde als van Micha: extra variabelen via een omweg toevoegen aan je lineaire model en kijken of die significante parameters hebben. Volgens mij werkt dat prima in dit geval.

Maar ik zal er nog eens goed over na denken of ik nog andere manieren kan bedenken.
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Verstuur e-mail
Maarten



Geregistreerd op: 23-4-2005
Berichten: 2055
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 1:25 pm    Onderwerp: Reageer met quote
Micha schreef:
Ik heb altijd geleerd dit te doen door middel van Block 1, Block 2, Block 3 ... in Analyze-Regression-Linear.

Waarbij Block 1 alleen de lineare onafhankelijke variabele bevat en Block 2 bijvoorbeeld (onafhankelijke variabele)^2 toevoegt.


@Micha: Als de afhankelijke variabele is Y en de onafhankelijke variabele is X.

Dan wil ik de volgende modellen met elkaar vergelijken (en toetsen of de fit bij 2 en 3 significant groter is dan bij 1):

Model 1: Y = X
Model 2: Y = X-kwadraat
Model 3: Y = log X

Als ik jouw methode gebruik dan krijg ik in de output (en dat sluit ook aan bij wat ik hierboven meen te lezen bij je):

Model 1: Y = X
Model 2: Y = X + X-kwadraat.

Maar ik wil dus niet vanuit een simpel model een meer complex model opbouwen (heet dat een genest model?), maar verschillende simpele modellen met elkaar vergelijken (elk met slechts 1 onafhankelijke variabele).

Of begrijp ik je niet goed?

Dank uiteraard voor de moeite!
Als ik jouw
_________________
Reason - Individualism - Capitalism
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Bekijk de homepage
Micha



Geregistreerd op: 25-9-2009
Berichten: 93
Woonplaats: Londen

BerichtGeplaatst: Wo Mrt 03, 2010 1:29 pm    Onderwerp: Reageer met quote
Ik denk dat de toevoeging van X² juist wel is wat je wil, toch?

Als de lineare regressievergelijking Y = a + bX is, dan is de kwadratische vergelijking Y = a + bX + cX².

For what it's worth, bij het economisch onderzoek wat ik gedaan heb is het altijd gebruikelijk om, als je bijvoorbeeld GDP onderzoekt, zowel GDP als GDP² in je model op te nemen om te controleren voor juist dat kwadratische effect.
Naar boven
Bekijk gebruikers profiel Stuur privé bericht
Maarten



Geregistreerd op: 23-4-2005
Berichten: 2055
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 1:41 pm    Onderwerp: Reageer met quote
Micha schreef:
Ik denk dat de toevoeging van X² juist wel is wat je wil, toch?

Als de lineare regressievergelijking Y = a + bX is, dan is de kwadratische vergelijking Y = a + bX + cX².


okee, ik zie je punt.

Maar wanneer ik de fit bestudeer zoals hierboven beschreven (Analyze -> regression --> curve estimation), dan krijg ik drie plaatjes met respectievelijk een rechte lijn erdoor, een curvilineair verband en een parabool. Daarbij staan de volgende R-kwadraten:

lineair: 0.024
logaritmisch: 0.042
kwadratisch: 0.065

Ik moet dus kijken of DEZE getallen significant van elkaar verschillen.

Wanneer ik via jouw methode (Analyze --> Regression --> lineair) bij blok 1 X invoer (of X-kwadraat of log X), dan krijg ik dezelfde R-kwadraats (0.024, 0.042 en 0.065) als wanneer ik Curve-estimation gebruik. Dat is dus de bedoeling! Anders gezegd: kennelijk is die modelpassing die SPSS gebruikt bij die Curve Estimation Y=X-kwadraat (En NIET Y= X + X-kwadraat)

Als ik Y=a+bX+cX-kwadraat zou gaan passen, dan is b niet noodzakelijkerwijs gelijk aan nul, en dan onderzoek ik niet langer de verschillen tussen de hierboven genoemde getallen (0.024, 0.042 en 0.065). Ik snap wel wat je bedoelt, maar dan toets ik een ander model toch?

Sowieso zie ik in de output van de door jouw voorgestelde methode niet of en waar de model-fits van de verschillende modellen worden vergeleken. Je ziet bijvoorbeeld wel dat toevoeging van een term (b.v. X-kwadraat) de verklaarde variantie van het model verandert, maar waar staat de toets dat dat significant meer of minder is dan de verklaarde variantie van het oorpsornkelijke model?
_________________
Reason - Individualism - Capitalism
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Bekijk de homepage
JPL



Geregistreerd op: 23-4-2005
Berichten: 2081
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 1:58 pm    Onderwerp: Reageer met quote
Even voor de zekerheid: volgens mij is het juist zo dat als je wilt kijken of het model y = aX^2 + bX + c beter is dan het model y = aX + b, je vooral moet kijken of in het eerste model de geschatte parameter a significant van 0 verschilt en dat je dus niet primair naar de R^2 kijkt. Bedoelen we hetzelfde?
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Verstuur e-mail
Maarten



Geregistreerd op: 23-4-2005
Berichten: 2055
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 2:12 pm    Onderwerp: Reageer met quote
Voor de duidelijkheid: Weliswaar staat op mijn boeken dat ik econometrist ben, maar preciezer is het dat ik Operations Research heb gedaan. Mijn laatste vak econometrie was in 1994 Embarassed (Voor het geval dat mensen zich afvragen waarom ik hier uberhaupt vragen over stel (*blush**))

@JPL: ik zou zeggen dat de R-kwadraat belangrijker is. Dat is een maat voor de algehele modelpassing. Dat is bovendien ook wat ik van een reviewer als opdracht heb meegekregen.

Wat jij voorstelt, kijken of een parameter significant afwijkt van nul, is volgens mij lastiger, aangezien met meer dan 1 onafhankelijke variabele, de parameters afhangen van de keuzes over de andere onafhankelijke variabelen die je opneemt in het model.

Maar het belangrijkste is volgens mij dus (zoals hierboven al uitgelegd) dat ik niet het verschil moet bekijken tussen Y=X en Y=X + X-kwadraat, maar tussen Y=X en tussen Y = X-kwadraat.
Dat is namelijk wat SPSS zelf doet bij die Curve Estimation.

Mijn opdracht is om het verschil tussen 0.024, 0.042 en 0.065 te toetsen. En dat zijn de R-kwadraats behorende bij de modellen:
Y=X
Y=K-kwadraat
Y=log X
_________________
Reason - Individualism - Capitalism
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Bekijk de homepage
JPL



Geregistreerd op: 23-4-2005
Berichten: 2081
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 2:43 pm    Onderwerp: Reageer met quote
@Maarten:

de reden van het kijken naar de significantie van de parameters in plaats van de r^2 is dat je op die manier kijkt of een variabele ook echt iets toevoegt aan je model.
De r^2 zal bijna per definitie groter worden als je variabelen toevoegt, zelfs als die variabelen totaal irrelevant zijn. Dat heeft allemaal met vrijheidsgraden enzo te maken. Maar daarom zegt die r^2 niet zo gek veel.

Maar het lijkt net alsof je belangrijke informatie nog niet verteld hebt. Want ik kan me zo moeilijk voorstellen dat je y=aX^2 probeert te schatten, zonder constante en zonder lineaire term. Misschien kun je iets meer over je onderzoek vertellen.
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Verstuur e-mail
Maarten



Geregistreerd op: 23-4-2005
Berichten: 2055
Woonplaats: Amsterdam

BerichtGeplaatst: Wo Mrt 03, 2010 3:23 pm    Onderwerp: Reageer met quote
JPL schreef:
De r^2 zal bijna per definitie groter worden als je variabelen toevoegt


Maar dat is dus niet de bedoeling. Bij de genoemde curve estimation worden drie modellen vergeleken die elk precies 1 onafhankelijke variabele hebben. Dan is de R-kwadraat toch wel degelijk vergelijkbaar? Als maat voor de fit? (behalve dan het verschil in vrijheidsgraden). En het is toch ook mogelijk om de verschillen in R2 te toetsen?

Het gaat er mij dus puur om of het verschil in R2-kwadraat significant is. Op zich is het een interessante vraag of er ook nog betere benaderingen zijn, maar ik heb nogmaals de concrete opdracht op te toetsen of er significante verschillen zijn in de R-kwadraat tussen:

Y = a+bX
Y = a+b logX
Y= a+b X-kwadraat.

SPSS geeft dus idd (uiteraard) wel gewoon een constante. Maar bij het kwadratische model zet hij de parameter voor de X op 0.000 (dus zonder lineaire term). De vorm van het model is dus zoals hierboven.

Ik heb dus al de getallen (R-kwadraten). Maar geeft SPSS de mogelijkheid om dee drie verschillende modellen (met bijbehorende R-kwadraten) zoals hierboven (modellen die SPSS zelf gegenereerd heeft!) tegen elkaar te toetsen? Dat is in feite alles wat ik wil weten.
_________________
Reason - Individualism - Capitalism
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Bekijk de homepage
Maarten



Geregistreerd op: 23-4-2005
Berichten: 2055
Woonplaats: Amsterdam

BerichtGeplaatst: Ma Mrt 08, 2010 10:08 am    Onderwerp: Reageer met quote
Up...
_________________
Reason - Individualism - Capitalism
Naar boven
Bekijk gebruikers profiel Stuur privé bericht Bekijk de homepage
Plaats nieuw bericht   Plaats reactie    Bona's forum index // Discussie Tijden zijn in GMT
Pagina 1 van 1

 
Ga naar:  
Je mag geen nieuwe onderwerpen plaatsen
Je mag geen reacties plaatsen
Je mag je berichten niet bewerken
Je mag je berichten niet verwijderen
Ja mag niet stemmen in polls
Powered by phpBB