| Vorige onderwerp :: Volgende onderwerp |
Maarten
Geregistreerd op: 23-4-2005 Berichten: 2055 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 11:39 am Onderwerp: Statistische SPSS-vraag |
|
|
|
Reinier vroeg zich af wannneer Drs. Berg verandert in Dr. Berg. Welnu, er is nog een klein puntje wat dat in de weg staat.
Wanneer Reinier, Julius, Jona, Thomas, Adrian of wie dan ook met kennis van statistiek (in combinatie met SPSS) antwoord kent op onderstaande vraag, of mij in contact kan brengen met iemand, dan is mijn dank groot!
Het probleem:
Ik zet twee metrische variabelen (een onafhankele en een afhankelijke) tegen elkaar uit. Er is een positieve (lineaire) samenhang. Een correlatiecoefficient van ongeveer r = +0.40
Ik vergelijk echter de lineaire samenhang met de logaritmische samenhang en de kwadratische samenhang.
In SPSS is dat erg eenvoudig. We doen Analyze --> Regression --> Curve Estimation. We voeren nu de afhankelijke en de onafhankelijke variabele in. En onder 'Models' vinken we niet alleen linear aan (de default), maar ook logaritmic en quadratic.
In de output krijgen we nu voor elk van de drie pasvormen ('fits') de R-kwadraat (verklaarde variantie). Bij de kwadratische passing is de verklaarde variantie altijd het best, vanwege het feit dat er een vrijheidsgraad minder is. Dat kan dus geen reden zijn om een kwadratische passing aan te nemen.
Wat ik wil doen is toetsen of de niet-lineaire passing significant beter is dan de lineaire fit. En dan uiteraard ook of de logaritmische passing of de kwadratische passing van toepassing is.
Ik heb in dit verband wel eens de term 'Toets voor verandering R-kwadraat'. Dit zou gewoon een simpele F-toets moeten zijn? Maar volgens mij kan dit niet in SPSS. Weet iemand hoe dit moet? Kan het in SPSS? En zo nee, kun je je SPSS-datafile simpel omzetten in data die geschikt zijn voor een statistisch programma die dit wel doet?
Als jullie een antwoord hebben of iemand kennen die dit kan oplossen (redelijke betaling is geen probleem), dan hoor ik het graag. _________________ Reason - Individualism - Capitalism |
|
| Naar boven |
|
|
anne
Geregistreerd op: 26-4-2005 Berichten: 1688
|
Geplaatst: Wo Mrt 03, 2010 11:56 am Onderwerp: |
|
|
|
zijn hier geen boeken voor? er staan bij mij in de kast boeken met titels als multivariate statistics for the social sciences (en ondertitels als in SPSS, en nog twee andere programma's) _________________ Amsterdam EUDC 2010: 12-17 juli.
http://www.amsterdameudc.org |
|
| Naar boven |
|
|
Micha

Geregistreerd op: 25-9-2009 Berichten: 93 Woonplaats: Londen
|
Geplaatst: Wo Mrt 03, 2010 12:17 pm Onderwerp: |
|
|
|
Ik heb altijd geleerd dit te doen door middel van Block 1, Block 2, Block 3 ... in Analyze-Regression-Linear.
Waarbij Block 1 alleen de lineare onafhankelijke variabele bevat en Block 2 bijvoorbeeld (onafhankelijke variabele)^2 toevoegt. |
|
| Naar boven |
|
|
Maarten
Geregistreerd op: 23-4-2005 Berichten: 2055 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 1:19 pm Onderwerp: |
|
|
|
| anne schreef: | | zijn hier geen boeken voor? er staan bij mij in de kast boeken met titels als multivariate statistics for the social sciences (en ondertitels als in SPSS, en nog twee andere programma's) |
@Anne: ik heb uiteraard mijn boeken en internet uitvoerig afgespeurd, maar deze (ogenschijnlijk vrij simpele vraag) niet weten te vinden. _________________ Reason - Individualism - Capitalism |
|
| Naar boven |
|
|
JPL

Geregistreerd op: 23-4-2005 Berichten: 2081 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 1:22 pm Onderwerp: |
|
|
|
Mijn eerste reactie na het lezen van de vraag is dezelfde als van Micha: extra variabelen via een omweg toevoegen aan je lineaire model en kijken of die significante parameters hebben. Volgens mij werkt dat prima in dit geval.
Maar ik zal er nog eens goed over na denken of ik nog andere manieren kan bedenken. |
|
| Naar boven |
|
|
Maarten
Geregistreerd op: 23-4-2005 Berichten: 2055 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 1:25 pm Onderwerp: |
|
|
|
| Micha schreef: | Ik heb altijd geleerd dit te doen door middel van Block 1, Block 2, Block 3 ... in Analyze-Regression-Linear.
Waarbij Block 1 alleen de lineare onafhankelijke variabele bevat en Block 2 bijvoorbeeld (onafhankelijke variabele)^2 toevoegt. |
@Micha: Als de afhankelijke variabele is Y en de onafhankelijke variabele is X.
Dan wil ik de volgende modellen met elkaar vergelijken (en toetsen of de fit bij 2 en 3 significant groter is dan bij 1):
Model 1: Y = X
Model 2: Y = X-kwadraat
Model 3: Y = log X
Als ik jouw methode gebruik dan krijg ik in de output (en dat sluit ook aan bij wat ik hierboven meen te lezen bij je):
Model 1: Y = X
Model 2: Y = X + X-kwadraat.
Maar ik wil dus niet vanuit een simpel model een meer complex model opbouwen (heet dat een genest model?), maar verschillende simpele modellen met elkaar vergelijken (elk met slechts 1 onafhankelijke variabele).
Of begrijp ik je niet goed?
Dank uiteraard voor de moeite!
Als ik jouw _________________ Reason - Individualism - Capitalism |
|
| Naar boven |
|
|
Micha

Geregistreerd op: 25-9-2009 Berichten: 93 Woonplaats: Londen
|
Geplaatst: Wo Mrt 03, 2010 1:29 pm Onderwerp: |
|
|
|
Ik denk dat de toevoeging van X² juist wel is wat je wil, toch?
Als de lineare regressievergelijking Y = a + bX is, dan is de kwadratische vergelijking Y = a + bX + cX².
For what it's worth, bij het economisch onderzoek wat ik gedaan heb is het altijd gebruikelijk om, als je bijvoorbeeld GDP onderzoekt, zowel GDP als GDP² in je model op te nemen om te controleren voor juist dat kwadratische effect. |
|
| Naar boven |
|
|
Maarten
Geregistreerd op: 23-4-2005 Berichten: 2055 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 1:41 pm Onderwerp: |
|
|
|
| Micha schreef: | Ik denk dat de toevoeging van X² juist wel is wat je wil, toch?
Als de lineare regressievergelijking Y = a + bX is, dan is de kwadratische vergelijking Y = a + bX + cX². |
okee, ik zie je punt.
Maar wanneer ik de fit bestudeer zoals hierboven beschreven (Analyze -> regression --> curve estimation), dan krijg ik drie plaatjes met respectievelijk een rechte lijn erdoor, een curvilineair verband en een parabool. Daarbij staan de volgende R-kwadraten:
lineair: 0.024
logaritmisch: 0.042
kwadratisch: 0.065
Ik moet dus kijken of DEZE getallen significant van elkaar verschillen.
Wanneer ik via jouw methode (Analyze --> Regression --> lineair) bij blok 1 X invoer (of X-kwadraat of log X), dan krijg ik dezelfde R-kwadraats (0.024, 0.042 en 0.065) als wanneer ik Curve-estimation gebruik. Dat is dus de bedoeling! Anders gezegd: kennelijk is die modelpassing die SPSS gebruikt bij die Curve Estimation Y=X-kwadraat (En NIET Y= X + X-kwadraat)
Als ik Y=a+bX+cX-kwadraat zou gaan passen, dan is b niet noodzakelijkerwijs gelijk aan nul, en dan onderzoek ik niet langer de verschillen tussen de hierboven genoemde getallen (0.024, 0.042 en 0.065). Ik snap wel wat je bedoelt, maar dan toets ik een ander model toch?
Sowieso zie ik in de output van de door jouw voorgestelde methode niet of en waar de model-fits van de verschillende modellen worden vergeleken. Je ziet bijvoorbeeld wel dat toevoeging van een term (b.v. X-kwadraat) de verklaarde variantie van het model verandert, maar waar staat de toets dat dat significant meer of minder is dan de verklaarde variantie van het oorpsornkelijke model? _________________ Reason - Individualism - Capitalism |
|
| Naar boven |
|
|
JPL

Geregistreerd op: 23-4-2005 Berichten: 2081 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 1:58 pm Onderwerp: |
|
|
|
| Even voor de zekerheid: volgens mij is het juist zo dat als je wilt kijken of het model y = aX^2 + bX + c beter is dan het model y = aX + b, je vooral moet kijken of in het eerste model de geschatte parameter a significant van 0 verschilt en dat je dus niet primair naar de R^2 kijkt. Bedoelen we hetzelfde? |
|
| Naar boven |
|
|
Maarten
Geregistreerd op: 23-4-2005 Berichten: 2055 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 2:12 pm Onderwerp: |
|
|
|
Voor de duidelijkheid: Weliswaar staat op mijn boeken dat ik econometrist ben, maar preciezer is het dat ik Operations Research heb gedaan. Mijn laatste vak econometrie was in 1994 (Voor het geval dat mensen zich afvragen waarom ik hier uberhaupt vragen over stel (*blush**))
@JPL: ik zou zeggen dat de R-kwadraat belangrijker is. Dat is een maat voor de algehele modelpassing. Dat is bovendien ook wat ik van een reviewer als opdracht heb meegekregen.
Wat jij voorstelt, kijken of een parameter significant afwijkt van nul, is volgens mij lastiger, aangezien met meer dan 1 onafhankelijke variabele, de parameters afhangen van de keuzes over de andere onafhankelijke variabelen die je opneemt in het model.
Maar het belangrijkste is volgens mij dus (zoals hierboven al uitgelegd) dat ik niet het verschil moet bekijken tussen Y=X en Y=X + X-kwadraat, maar tussen Y=X en tussen Y = X-kwadraat.
Dat is namelijk wat SPSS zelf doet bij die Curve Estimation.
Mijn opdracht is om het verschil tussen 0.024, 0.042 en 0.065 te toetsen. En dat zijn de R-kwadraats behorende bij de modellen:
Y=X
Y=K-kwadraat
Y=log X _________________ Reason - Individualism - Capitalism |
|
| Naar boven |
|
|
JPL

Geregistreerd op: 23-4-2005 Berichten: 2081 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 2:43 pm Onderwerp: |
|
|
|
@Maarten:
de reden van het kijken naar de significantie van de parameters in plaats van de r^2 is dat je op die manier kijkt of een variabele ook echt iets toevoegt aan je model.
De r^2 zal bijna per definitie groter worden als je variabelen toevoegt, zelfs als die variabelen totaal irrelevant zijn. Dat heeft allemaal met vrijheidsgraden enzo te maken. Maar daarom zegt die r^2 niet zo gek veel.
Maar het lijkt net alsof je belangrijke informatie nog niet verteld hebt. Want ik kan me zo moeilijk voorstellen dat je y=aX^2 probeert te schatten, zonder constante en zonder lineaire term. Misschien kun je iets meer over je onderzoek vertellen. |
|
| Naar boven |
|
|
Maarten
Geregistreerd op: 23-4-2005 Berichten: 2055 Woonplaats: Amsterdam
|
Geplaatst: Wo Mrt 03, 2010 3:23 pm Onderwerp: |
|
|
|
| JPL schreef: | | De r^2 zal bijna per definitie groter worden als je variabelen toevoegt |
Maar dat is dus niet de bedoeling. Bij de genoemde curve estimation worden drie modellen vergeleken die elk precies 1 onafhankelijke variabele hebben. Dan is de R-kwadraat toch wel degelijk vergelijkbaar? Als maat voor de fit? (behalve dan het verschil in vrijheidsgraden). En het is toch ook mogelijk om de verschillen in R2 te toetsen?
Het gaat er mij dus puur om of het verschil in R2-kwadraat significant is. Op zich is het een interessante vraag of er ook nog betere benaderingen zijn, maar ik heb nogmaals de concrete opdracht op te toetsen of er significante verschillen zijn in de R-kwadraat tussen:
Y = a+bX
Y = a+b logX
Y= a+b X-kwadraat.
SPSS geeft dus idd (uiteraard) wel gewoon een constante. Maar bij het kwadratische model zet hij de parameter voor de X op 0.000 (dus zonder lineaire term). De vorm van het model is dus zoals hierboven.
Ik heb dus al de getallen (R-kwadraten). Maar geeft SPSS de mogelijkheid om dee drie verschillende modellen (met bijbehorende R-kwadraten) zoals hierboven (modellen die SPSS zelf gegenereerd heeft!) tegen elkaar te toetsen? Dat is in feite alles wat ik wil weten. _________________ Reason - Individualism - Capitalism |
|
| Naar boven |
|
|
Maarten
Geregistreerd op: 23-4-2005 Berichten: 2055 Woonplaats: Amsterdam
|
Geplaatst: Ma Mrt 08, 2010 10:08 am Onderwerp: |
|
|
|
Up... _________________ Reason - Individualism - Capitalism |
|
| Naar boven |
|
|