<div dir="ltr"><div class="gmail_default" style="font-size:small">nice explanation Margaret.<br></div><div class="gmail_default" style="font-size:small">Larry<br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Sep 27, 2014 at 10:08 PM, Margaret Wu <span dir="ltr">&lt;<a href="mailto:wu@edmeasurement.com.au" target="_blank">wu@edmeasurement.com.au</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div link="blue" vlink="purple" lang="EN-AU"><div><p class="MsoNormal">I think there appears to be some misunderstanding about imputation. Imputation never creates new data. Of course we cannot invent data. Here is a simple example about imputation. Suppose we have a data set with people’s height and weight measures, with some data records missing either height or weight measures. We carry out a regression with only complete data records (respondents with both height and weight measures). We obtain estimates of regression coefficients from this analysis (Analysis A). For the data records with missing responses, we can impute a value in the following way. Suppose person n has a weight of 65kg, but his/her height measure is missing. We look up the regression model from Analysis A, and look at the distribution of heights of people with a weight of 65kg. This (conditional) distribution represents the likely heights of people with a weight of 65 kg. We randomly draw an observation from this conditional distribution and produce an imputed height for person n. If we now re-analyse the data with the imputed height included, we first observe that the regression estimates should not change, since we imputed from the regression model obtained in Analysis A. However, the standard errors for the regression coefficients will now be smaller than those from Analysis A, because our second analysis assumes the imputed values are actually observed (so we have more data than actually observed). To make sure that we don’t have increased precision when imputed data are added, we make multiple imputations. For each imputed data set, we carry out a regression analysis. The results from these regressions will vary, because the imputed values are not the same each time, since we impute from a distribution. (Note that we do not use the mean of the conditional distribution as our imputed value. Instead we do a random draw). The variations between the multiple regression runs will reflect the uncertainty introduced by the imputations. We then have a formula for combining the multiple regression runs to add the uncertainty back into our regression parameters, so that the data sets with imputed values will produce just the same estimates and standard errors as for Analysis A.</p><p class="MsoNormal"> </p><p class="MsoNormal">So you may ask why bother to do imputation if the results of the imputed data sets produce the same results as the complete data set. Sometimes we have many variables of interest. If we have lots of missing values among different variables, and we do list-wise deletion of records, we may throw away a lot of records. Using imputation, we can have complete data sets for carrying out many statistical analyses, using all the data we have collected, and at the same time take into account that some data are missing.</p><p class="MsoNormal"> </p><p class="MsoNormal">There has been a lot of literature on imputation. See Rubin, Little, Graham, Schafer,…</p><p class="MsoNormal"> </p><p class="MsoNormal">Using plausible values (PV) is one method of imputation. I should mention that the methodology of PV was not invented by PISA. The work of Bock, Mislevy, among others, in the 1980s has greatly contributed to large-scale assessment methodologies. I think one misconception of people who are not familiar with Bayesian IRT is that you need to estimate individuals well before you can measure the population parameters well. Actually, in Bayesian IRT (or the MML method), individual person abilities are not parameters in the model to be estimated. Bayesian IRT models overcome a lot of issues relating to forming population estimates from individual ability estimates which contain measurement errors. A lot of work has been done in showing how the (so-called) PISA model works well for large-scale surveys. Of course, for PISA, there are always issues with real-life applications of mathematical models, but these issues are not those raised in the articles recently mentioned such as in this thread of discussion. It appears that there are “suspicions”, but there is a lack of a full understanding of the actual models, so some explanations about the methodologies may help.</p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">Margaret</span></p><p class="MsoNormal"><a name="148ba042067574ca__MailEndCompose"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"> </span></a></p><div><div style="border:none;border-top:solid #b5c4df 1.0pt;padding:3.0pt 0cm 0cm 0cm"><p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;" lang="EN-US">From:</span></b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;" lang="EN-US"> <a href="mailto:rasch-bounces@acer.edu.au" target="_blank">rasch-bounces@acer.edu.au</a> [mailto:<a href="mailto:rasch-bounces@acer.edu.au" target="_blank">rasch-bounces@acer.edu.au</a>] <b>On Behalf Of </b>Paul Barrett<br><b>Sent:</b> Sunday, 28 September 2014 7:46 AM<br><b>To:</b> <a href="mailto:rasch@acer.edu.au" target="_blank">rasch@acer.edu.au</a><br><b>Subject:</b> Re: [Rasch] PISA critique in TES</span></p></div></div><p class="MsoNormal"> </p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">I came across this paragraph in an ‘explanatory’ article in:</span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"><a href="http://understandinguncertainty.org/about" target="_blank">http://understandinguncertainty.org/about</a></span></p><p class="MsoNormal"><i><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">What is this site?</span></i></p><p class="MsoNormal"><i><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">This site is produced by the Winton programme for the public understanding of risk based in the Statistical Laboratory in the University of Cambridge</span></i><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">The article is at:</span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"><a href="http://understandinguncertainty.org/pisa-statistical-methods-more-detailed-comments" target="_blank">http://understandinguncertainty.org/pisa-statistical-methods-more-detailed-comments</a></span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">The paragraph which caught my interest was:</span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#000057" lang="EN-NZ">A simple Rasch model (PISA Technical Report , Chapter 9) is assumed, and five values for each student are generated at random from the &#39;posterior&#39; distribution given the information available on that student. </span><u><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#5a0323" lang="EN-NZ">So for the half of students in 2006 who did not answer any reading questions</span></u><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#5a0323" lang="EN-NZ">, five &#39;plausible&#39; reading scores are generated on the basis of their responses on other subjects</span><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#000057" lang="EN-NZ">.</span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">Look at that last sentence, and the bit I’ve underlined. Ordinarily, as a scientist rather than statistician, I’d burst out laughing at such an idiotic research design which ended up with this state of affairs as a purposeful ‘design’ feature. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">But maybe the “imputation” prediction model really does work as claimed on such data? My laughing is foolish after all. I’m not interested in simple monte-carlo  expositions, but with what happens with real data, messy sampling, and items which don’t all fit the Rasch model. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">And, indeed, empirical evidence using such PISA appears to exist, detailing the accuracy of the plausible value procedure to correctly estimate the population scores for students who answer no items at all on reading ability, from scores on other variables (Svend Kreiner). The result seems to indicate that it is substantively <u>inaccurate</u>. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">The validity or otherwise of such ‘plausible values’ claims are matters for empirically-determined quantified predictive accuracy, where actual observational data are used, doing exactly what PISA does on say several groups of students who have undertaken several ‘same-item’ tests on two or more attributes, Then re-estimating the population parameters for each group based upon half of that group not answering any questions for a particular attribute. This is not rocket science.  I’m assuming it has been done and published, and replicated by independent research groups? (Anyone have a reference or two)?</span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ">If this is so, it is puzzling how Kriener’s analyses could have revealed contrasting results.</span></p><div><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT">Regards .. Paul</span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"> </span></p><p class="MsoNormal"><i><span style="font-size:9.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:black" lang="EN-US">Chief Research Scientist</span></i></p><p class="MsoNormal"><b><span style="font-size:9.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:black" lang="EN-US">Cognadev.com</span></b></p><p class="MsoNormal"><b><span style="font-size:4.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="DE-AT">__________________________________________________________________________________</span></b></p><p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:Consolas;color:#f7154b" lang="DE-AT">W</span></b><span style="font-size:10.0pt;font-family:Consolas;color:black" lang="DE-AT">:</span><span style="font-size:10.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"> </span><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"><a href="http://www.pbarrett.net/" target="_blank"><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;" lang="DE-AT">www.cognadev.com</span></a></span><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:black" lang="EN-NZ"> </span><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"></span></p><p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:Consolas;color:#f7154b" lang="DE-AT">W</span></b><span style="font-size:10.0pt;font-family:Consolas;color:black" lang="DE-AT">:</span><span style="font-size:10.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"> </span><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"><a href="http://www.pbarrett.net/" target="_blank"><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;" lang="DE-AT">www.pbarrett.net</span></a></span><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:black" lang="EN-NZ"> </span><span style="font-size:10.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"></span></p><p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:Consolas;color:#f7154b" lang="DE-AT">E</span></b><span style="font-size:10.0pt;font-family:Consolas;color:black" lang="DE-AT">:</span><span style="font-size:10.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"> </span><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"><a href="mailto:paul@pbarrett.net" target="_blank"><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;" lang="DE-AT">paul@pbarrett.net</span></a></span><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:black" lang="EN-NZ"> </span><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"></span></p><p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:Consolas;color:#f7154b" lang="DE-AT">M</span></b><span style="font-size:10.0pt;font-family:Consolas;color:black" lang="DE-AT">:</span><span style="font-size:10.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"> </span><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"><a href="tel:%2B64-%280%2921-415625" value="+6421415625" target="_blank">+64-(0)21-415625</a></span><span style="font-size:10.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black" lang="DE-AT"></span></p></div><p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-NZ"> </span></p><div><div style="border:none;border-top:solid #e1e1e1 1.0pt;padding:3.0pt 0cm 0cm 0cm"><p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-US">From:</span></b><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;" lang="EN-US"> <a href="mailto:rasch-bounces@acer.edu.au" target="_blank">rasch-bounces@acer.edu.au</a> [<a href="mailto:rasch-bounces@acer.edu.au" target="_blank">mailto:rasch-bounces@acer.edu.au</a>] <b>On Behalf Of </b>Adams, Ray<br><b>Sent:</b> Saturday, September 27, 2014 2:08 PM<br><b>To:</b> rasch<br><b>Subject:</b> Re: [Rasch] PISA critique in TES</span></p></div></div><p class="MsoNormal"><span lang="EN-NZ"> </span></p><div><p class="MsoNormal"><span lang="EN-NZ">Mike,</span></p></div><div><p class="MsoNormal"><span lang="EN-NZ"> </span></p></div><div><p class="MsoNormal"><span lang="EN-NZ">We have always shown things like range of possible ranks, standard errors and so on. We&#39;ve also reported the effects of item selection and all data collected is publicly accessible for others to scrutinise.</span></p></div><div><p class="MsoNormal"><span lang="EN-NZ"> </span></p></div><div><p class="MsoNormal"><span lang="EN-NZ">Morrison dismisses all latent variable models kreiner says throw away everything that doesn&#39;t fit rasch perfectly and Goldstein says we throw away too much</span></p></div><div><p class="MsoNormal"><span lang="EN-NZ"> </span></p></div><div><p class="MsoNormal"><span lang="EN-NZ">Oh, and the comments about plausible values are just statistical naïveté, believe them and NAEP would have to be scrapped as would any statistical methods that use montecarlo estimation, the theory of which was regarded as sound last time I looked.</span></p></div><div><p class="MsoNormal"><span lang="EN-NZ"> </span></p></div><div><p class="MsoNormal"><span lang="EN-NZ">I love this criticism, it shows pisa is important. Putting energy into criticising it is good, I just wish genuine problems were uncovered and addressed. Goldstein does best on that front, I too would love longitudinal components and more finer grained analyses of subsets of items</span></p></div><div><p class="MsoNormal"><span lang="EN-NZ"> </span></p></div><div><p class="MsoNormal"><span lang="EN-NZ">Ray</span></p></div><div><p class="MsoNormal"><span lang="EN-NZ"><br>Sent from my iPhone</span></p></div><div><p class="MsoNormal" style="margin-bottom:12.0pt"><span lang="EN-NZ"><br>On 27 Sep 2014, at 11:13 am, Mike Linacre &lt;<a href="mailto:mike@winsteps.com" target="_blank">mike@winsteps.com</a>&gt; wrote:</span></p></div><blockquote style="margin-top:5.0pt;margin-bottom:5.0pt"><div><div><p class="MsoNormal"><span lang="EN-NZ">Thanks, T.<br><br>That article, and the comments following it, suggest to me that PISA results should be reported as box-and-whisker plots, not rankings. Then every country could choose to be at the top of its own whisker ....<br><br>&lt;mime-attachment.png&gt;<br>Or perhaps PISA already do this??<br><br>Mike Linacre<br><br>On 9/27/2014 10:18 AM, Bond, Trevor wrote:</span></p></div><blockquote style="margin-top:5.0pt;margin-bottom:5.0pt"><pre><span lang="EN-NZ"><a href="http://www.tes.co.uk/article.aspx?storycode=6344672" target="_blank">http://www.tes.co.uk/article.aspx?storycode=6344672</a></span></pre><pre><span lang="EN-NZ">Collegially</span></pre><pre><span lang="EN-NZ">TGB</span></pre></blockquote><p class="MsoNormal" style="margin-bottom:12.0pt"><span lang="EN-NZ"> </span></p></div></blockquote><blockquote style="margin-top:5.0pt;margin-bottom:5.0pt"><div><p class="MsoNormal"><span lang="EN-NZ">________________________________________<br>Rasch mailing list<br>email: <a href="mailto:Rasch@acer.edu.au" target="_blank">Rasch@acer.edu.au</a><br>web: <a href="https://mailinglist.acer.edu.au/mailman/options/rasch/ray.adams%40acer.edu.au" target="_blank">https://mailinglist.acer.edu.au/mailman/options/rasch/ray.adams%40acer.edu.au</a></span></p></div></blockquote></div></div>
<br>________________________________________<br>
Rasch mailing list<br>
email: <a href="mailto:Rasch@acer.edu.au">Rasch@acer.edu.au</a><br>
web: <a href="https://mailinglist.acer.edu.au/mailman/options/rasch/ludlow%40bc.edu" target="_blank">https://mailinglist.acer.edu.au/mailman/options/rasch/ludlow%40bc.edu</a><br></blockquote></div><br><br clear="all"><br>-- <br><div dir="ltr"><div><div><div><div><div><div>Larry Ludlow, PhD<br></div>Professor and Department Chair<br></div>Educational Research, Measurement and Evaluation Department<br></div>Lynch School of Education <br>Boston College<br></div>140 Commonwealth Avenue<br></div>Campion Hall 336C<br></div>Chestnut Hill, MA 02467<br>617-552-4221<br></div>
</div>