תגובה לרשומת “ריקי כהן” בבלוג “דעת מיעוט”

עברה שנה מאז רשומת ה”ריקי כהן” הראשונה, רשומה פופולרית במיוחד בבלוג המצוין “דעת מיעוט“, שטענה שבניגוד לסנטימנט הכללי דאז, משפחת ריקי כהן אכן מייצגת את מעמד הביניים בישראל. הרשומה – והפרשה – מאחורינו פחות או יותר, אבל אני מהאסכולה של “מוטב מאוחר (או מאוחר מאוד) מלעולם לא”. מה גם שלכותב רציני מגיע תשובה רצינית: ניכר שאורי כץ, כותב הבלוג, שותף ללא מעט מהערכים שמובילים את הבלוג כאן, ועל כן במובנים רבים אני רואה בו כשותף למטרה – לשפר את רמת הדיון, להמנע מטיעונים לא רלוונטים או שגויים, להסתמך על עובדות ונתונים כשאפשר, וכו’. לכן, אף שאבקר כאן את הרשומה, חשוב לי להדגיש שזה נעשה דווקא וספציפית מתוך כבוד למה שכץ עושה. אטען שהרשומה כושלת ברמת המתודולוגיה, וחוטאת בחוסר רלוונטיות לשאלה לה היא מתיימרת לענות.

קודם כל שאלת המוצא: הרשומה באה לענות על השאלה, “האם משפחת כהן אכן (דוגמא ה)מייצגת את מעמד הביניים בישראל?” (לא ציטוט). השאלה הזו עניינה בזמנו הרבה אנשים – על כך העיד כץ עצמו ברשומת ההמשך, כשציין שהרשומה הייתה הנקראת ביותר בבלוג שלו, בהפרש ניכר. השאלה מעניינת כיוון שאם התשובה לשאלה שלילית, יוצא ששר אוצר בישראל הביא למשרדו מתווה מדיניות שמראש מבוסס על קריאה שגויה של מהי הקבוצה לה הוא מנסה, לפחות ברמת ההצהרה, לסייע.

כמובן שלא ניתן לדבר על “מעמד ביניים” במופשט – צריך לתת הגדרה כלשהי למה אנו מתכוונים בכך; זאת, לא כיוון שהגדרות בעצמן מוכיחות משהו (שגיאה נפוצה של הטוקבקיסט החכמולוג), אלא פשוט כדי שהקורא ידע שהוא מבין, פשוטו כמשמעו, על מה הכותב מדבר – גם אם ההגדרה אינה 100% אמפירית. “מעמד ביניים”, הרי, אינו מונח שפרושו ברור לכל – בניגוד, למשל, ל”כדור טניס”, “יצחק רבין” או “אנשים בגילאי 30+” – ולכן מצריך הבהרה. כל עוד אנו עקביים עם משמעות זו, יש לנו בסיס לבנות טיעון רלוונטי לשאלה. ואילו הרשומה, מצידה, מספקת מספר הגדרות שונות ואף סותרות למונח (ללא הסבר לכך), ולבסוף משתמשת בהגדרה שהופכת את התשובה – ואת השאלה שלנו – ללא מעניינת (ובמובן מסוים אף לטריויאלית). נתחיל:

הרשומה מתחילה מהגדרה אמפירית של מעמד הביניים: כל מי שהכנסתו נמצאת בטווח מסויים (75%-125%) מהשכר הממוצע. לצרכי נוחות נקרא לקריטריון הזה “קריטריון ההכנסה (למעמד הביניים)”. אמנם יש בעייתיות ידועה בהתייחסות לממוצע בתחומי שכר, במיוחד כשבאים לטעון שהוא סממן מייצג לקבוצה מסויימת, אבל כל קריטריון הוא במובן מסויים שרירותי – אפשר בהחלט להחליט שמקבלים אותו. אז הלאה, נרוץ עם קריטריון ההכנסה.

או שלא. שתי פסקאות אחר כך הרשומה קובעת ש”באופן אינטואיטיבי [..] ישראל ישראלי ייצג את מעמד הביניים הישראלי לאורך כל חייו, ולא רק בתקופה כזו או אחרת”. אין בעיה, אבל ברור שבמשמעות המובאת כאן מדובר בקריטריון אחר ממה שהובא לפני כן: קבוצה מסויימת אופיינית של אנשים, השייכים למעמד הזה. כלומר יש כאן קריטריון חדש, שמתמקד במאפיינים טיפוסיים של מעמד הביניים, כפי שאנו אינטואיטיבית תופסים אותו. נקרא לקריטריון הזה “קריטריון הטיפוסיוּת (של מעמד הביניים)”. אין בעיה עקרונית לאמץ את קריטריון הטיפוסיות, אבל חשוב לשים לב ששני הקריטריונים אינם דומים, והרשומה אף מדגימה כיצד: במשך חלקים משמעותיים מחייו, “ישראל ישראלי” מרוויח פחות מקריטריון ההכנסה – כלומר לא עומד בו – אבל גם אז עומד בקריטריון הטיפוסיות. בסדר, אימצנו את קריטריון הטיפוסיות, וניגש לניתוח הסטטיסטי, המרכיב את עיקר הרשומה.

 משאימצנו את קריטריון הטיפוסיות, טבעי היה לצפות שהרשומה תיגש לשרטט איזשהם “קווים לדמותו” של מעמד הביניים כדי לצקת תוכן לקריטריון. אולם עם המעבר לניתוח הכנסות לפי מספר הילדים, אנו קוראים ש”לפי לפיד, לריקי ובעלה יש שלושה ילדים. איך נראית הכנסתם [..] בהשוואה למשפחות אחרות עם שלושה ילדים?” רגע – פיספסתי שלב? למה אנחנו שואלים אם הכנסת משפחת כהן דומה למשפחות עם שלושה ילדים? או, בהמשך, למשפחות הגרות באותו אזור שמשפחת כהן גרה בו, או למידת הפריפריאליות שלהם? שאלת המוצא לכל הרשומה הייתה האם משפחת כהן מייצגת את מעמד הביניים. משום מה מנקודה זו ברשומה השאלה עוברת להיות, האם משפחת כהן מייצגת משפחות שדומות לה, מבחינת המאפיינים שלהן?

כמובן שבדומה למה שאמרנו לעיל, אפשר להחליט שהקריטריון “דוגמת-משפחת-כהן-כפי-שיאיר-לפיד-הציג-אותה” הוא הקריטריון למעמד הביניים (מעתה, “קריטריון משפחת כהן”), ובפועל זה מה שהרשומה עושה מנקודה זו ואילך, ואכן על סמך קריטריון זה היא מסיקה את התשובה החיובית לשאלת המקור. מה שחשוב להבין בבחירת הקריטריון הזה, זה שיוצא ממנה ששאלת המוצא כעת זהה לחלוטין, לוגית, לשאלה “האם משפחת כהן אכן (דוגמא ה)מייצגת משפחות כמו משפחת כהן?”

כעת, על אף מה שניתן היה לחשוב ברגע ראשון, התשובה לשאלה הזו אינה בהכרח טריויאלית (“כן”). אם נרצה, ניתן תמיד למצוא משפחה שאינה דומה למשפחות רבות אחרות בעלות מאפיינים כלליים שדומים לה (וברמה מסויימת כל משפחה אינה “מייצגת”). אבל בין אם התשובה טריויאלית ובין אם לא, הבעיה איננה בתשובה אלא בשאלה עצמה – היא לא מעניינת. פרטתי בפסקה השנייה מדוע שאלת המוצא מעניינת – תשובה שלילית תאמר לנו משהו על שר האוצר שלנו. ואילו לשאלה החדשה, גם תשובה חיובית וגם תשובה שלילית פשוט לא תאמר לנו יותר מדי – היא בטח לא תתן לנו אינדיקציה שיאיר לפיד צודק יותר או פחות בקריאתו של מהו מעמד ביניים, כי קל מדי, ומוצדק לגמרי, לטעון שקריטריון משפחת כהן היא הגדרה מצ(ו)מצמת הרבה יותר מדי למעמד הזה. לכן, על אף השימוש הראוי בפני עצמו בניתוח נתונים כדי לברר את שאלת המוצא, הרשומה חוטאת בחוסר רלוונטיות, כשממירה את השאלה הזו בשאלה אחרת, דלה הרבה יותר.

[עד כאן הטיעון העיקרי שלי על הרשומה. הערה נוספת לסיום, שאינה מהותית לטיעון שלי ושבפרוש משנית לה (ושאינה ברמת ההגיון ה”טהור”): לאורך הניתוח כאן, קיבלנו את הקריטריון (האחרון) שכץ מציע למעמד הביניים, כדי שלא להיתלות על הגדרות אלא על טיעונים. אולם לקראת סוף הרשומה כץ עושה קפיצה לא מבוססת כשמסיק, מהתשובה החיובית לשאלה החדשה, ש”האש הרבה שספג לפיד איננה מוצדקת. מלכתחילה הוא דיבר על מעמד הביניים, ורץ לבחירות על גלי התמיכה של מעמד הביניים.” שוב, “מעמד ביניים” אינו מושג מוגדר ומוסכם. כשמסיק ש”האש הרבה שספג לפיד אינה מוצדקת”, כץ בעצם מניח שההבנה שלו של מהו מעמד הביניים הוא גם מה שלפיד דיבר עליו (“מלכתחילה”) ו – חשוב מכך בהרבה – פחות או יותר מה שמצביעיו הבינו. אולי, אולי לא. אבל כל עוד לפיד לא פרט יותר לאורך מערכת הבחירות, למה התכוון ב”מעמד הביניים” – לא שהוא היה חייב – תהיה לדעתי עילה עקרונית לבקר אותו על תפישה יותר או פחות סבירה של מי מרכיב את הקבוצה הזו. ואם, למשל, יש מצביעים שסברו שהם כלולים במעמד הביניים, ורק לאחר שלפיד נבחר מגלים ממנו שבעצם התכוון בכלל לקבוצה אחרת, יש להם הצדקה למחות על כך.

וגם, הייתי מוסיף, חובה להזהר להבא ממילים מעורפלות מפי פוליטיקאים.] י

Advertisements

Bad Statistics, Worse Science Writing

As if bad statistics – “bad science” being kind of weak shorthand – wasn’t bad enough in fueling conspiratorial anti-research sentiment (which the Net is teeming with), science-reporting-in-service-of-revenue comes along and makes it all flat out ridiculous.

The scientific validity of the recently-published “QWERTY Effect” – claiming that words implementing letters from the right-hand side of the modern keyboard tend to have a more positive mental association than left-hand words – was demolished within days of its publication. But in that short space of time, science writers vying for attention in a crowded media field really outdid themselves. As Geoffrey Pullum of the Chronicle noted in an article on this issue (also coining the wonderful term, “unresult”):

Publicity for the unresult of their paper in Psychonomics Bulletin and Review has garnered them some appallingly stupid press coverage (“The Keyboards Are Changing Our Language!“; Just Typing ‘LOL’ Makes You Happy“; etc.). The worst I saw was in the Metro, a free tabloid in Britain: “SEX is depressing—but only if you use your left hand,” they began. “Typing letters with your left hand conveys more negative emotions than typing with your right, British and U.S. scientists say.” (The authors say nothing about what “conveys more negative emotions,” of course.) And in conclusion: “despite their meaning, words such as ‘lonely’ cheer us up more than, say, ‘sex’.” (If there was ever a worse example of illicit inference about particular cases from aggregated results, don’t show it to me, I might cry.)

Couldn’t have put it better. Betcha it sold some papers, though!

R.I.P, Statistical Abstract of the USA

The US Statistical Abstract, published annually since 1878, is being cut from the latest federal budget. I personally think that easy, open access to a wide range of data is one of the most overlooked positive consequences of government, and arguably one of the most important service a federal government can provide, with ramifications far beyond the technical act of record keeping. This is a terrible mistake, and a real shame.

Robert Samuelson nicely mirrors my thoughts on this here and here. Also check out David Cay Johnston’s somewhat crude but still debate-worthy calculations on this issue, under the title “Budget Cuts That Raise Costs“.

The New Hampshire Poverty Phenomenon… Adjusted

Some good, good friends of mine are moving from Israel to Manchester, New Hampshire. Yep, New Hampshire. Among their factors for choosing this rather eyebrow-raising destination is NH’s economic freedom. My friends are libertarians, so in their world view not only is economic freedom good – a lot of people would agree with that to no small extent – but in fact there’s practically no limit. The more the merrier. And New Hampshire is economically America’s freest state¹. So New Hampshire it is, -11ºC (12ºF) winters and all.

Libertarians have been pouring a lot of love on this otherwise oft-overlooked state (though some gripes remain). New Hampshire’s economic freedom has made it home base for the Free State Project, a libertarian movement calling for 20,000 like-minded folks from around the world to up stakes and move there (if you’re interested, the site explains why). You can kind of get the gist of the sentiment from the state’s official motto: “Live free or die”.

Of particular interest to this blog is the sometimes proud pointing out that the freest state also has the lowest poverty level in the US (although some say this might be changing). Writing on this very issue, Michael Nystrom of the Daily Paul (tagline, “inspired by Ron Paul”), wrote: “Does anyone see a connection?”

On the face of it, this is one hell of a coup for libertarians – seemingly a death-blow to progressive (or other) notions that the lower classes are invariably victims of freer economies. It almost speaks for itself – “See? Free up the economy and it’ll help the poor!”

Well, maybe – but these numbers don’t show it. We have a list of the freest states, as well as one for poverty levels². Here’s the thing – the next freest state, South Dakota, is #26 on the poverty level list, nowhere near NH. But maybe that’s a fluke. Let’s keep going – the 3rd freest state, Indiana, does even worse – #32 on the poverty list. The next freest, Idaho, does better at #12, but then comes Missouri, into the 20’s again at #25. Keep going down the list and, of the top 30 freest states, only 3 crack the top 10 lowest poverty rates (besides NH, none of these make the top 5). When Nystrom asked his presumably rhetorical question – implying that NH’s very low poverty levels must be as the result of its economic freedom – He might have checked if this connection holds with the other states before asking it. A simple statistical test across states shows that the correlation is effectively zero³ (and if anything just the tiniest bit negative).

Does this mean economic policy has no effect on poverty? Of course not. Only that deriving any meaning from these two sets of figures is invalid. If you’re going to parade around two statistics that look really nice, intellectual rigor requires you put your numbers where your mouth is, and in this case the link just doesn’t hold.

So where does all this leave NH? Well, besides a huge dollop of freedom, there’s something else New Hampshire has a lot of – Caucasians. In fact, New Hampshire is the 4th “whitest” state, with only 7.7% of all minorities combined, placing it in the 6th percentile. Just to give you an idea of how low that is, 40 states have more than double – and 30 more than triple – that percentage. in fact, the national state average is nearly four times the New Hampshire percentage of minorities. Things aren’t much better when it comes specifically to African-Americans: at 1.7%, NH has the 6th fewest of the states, placing it in the 12th percentile. Once again, 40 states have more than double their percentage, and fully half the states have more than 6 times that percentage. You don’t even want to know how many times that the national average is (8). (If I may brag, I didn’t get all this from any article, etc., but rather sat down and calculated everything using data from the 2010 US census.)

But do minorities and/or specifically African-American percentages correlate with poverty rates? Well, whole volumes have been written on this topic, but even from a cursory analysis of these three datasets, the answer for both is clearly in the affirmative⁴. This means that when it comes to poverty rates, simply having minority populations will, all else being equal, skew the numbers upwards. It’s important to say – lest I be misunderstood – that this in no way means minority populations are necessarily a cause of poverty (remember that old adage “correlation doesn’t imply causation”). All it means is that in order to gauge whether economic policy affects the poverty levels across states, you have to adjust for factors that correlate with poverty but don’t in themselves stem from such policies – and minority makeup is such a factor.

So the question now becomes, how does NH perform compared to its expected poverty rate when adjusted for minority size? The short answer is: subject to an important caveat (specified below, for the statistically minded) NH’s performance falls to #13. Not bad, but combined with the poor predictive powers of the economic freedom rankings, not enough to serve as rigorous proof that economic freedom alone brings low poverty levels.

[The caveat: First, one can’t factor separately for “minorities” and “AAs”, since one includes the other. So I ran the numbers, and found quite an impressive correlation between both African-American and Hispanic populations, and poverty, in states that have any minorities to speak of. The states that have very few lose this statistical connection, presumably because when you’re down to the 1-3% levels of minorities, there’s only so much they can mathematically still “explain”). So one can’t make a perfect adjustment. However, in comparing NH to other states, adjusted for the relationship seen in the top 20 states by combined AA and hispanic population, it was #13 in poverty levels.]

[Thanks, Liz, for giving me the idea to pursue this thread.]

¹ according to the libertarian George Mason University.
² freedom and poverty rankings are both current. Ideally, to check a causal connection one would have to check for freedom a few years back, to see their effect on poverty today. However, 1) I didn’t have the time to start carrying out more complex causal chain models, 2) this isn’t a professional analysis, and so I just assumed ad-hoc today’s freedom level correlates closely enough with those of a few years ago, and 3) those referenced above haven’t taken this into account either.
³ Spearman rank correlation coefficient -0.057. There are different schools on interpreting when the Spearman coefficient means there’s a correlation, but the most permissive start considering a “moderate correlation” from +/- 0.3 (others only from +/- 0.5). Either way, this isn’t even close.
⁴ Pearson coefficient +0.34 and  +0.44 for minorities and for African-Americans, respectively. Why are you reading this? Nerds…