?

Log in

[sticky post] верхний пост

Этот журнал функционирует в режиме "только для взаимных друзей". Я регулярно читаю то, что пишут мои друзья, поэтому очень придирчиво отношусь к их отбору. В этот небольшой круг попадают те, кто является психологом или социологом, либо интересуется анализом данных, либо сам хорошо пишет о себе и своей жизни. Копипастеров и политоту прошу не беспокоиться

влюбляюсь в Джулию

Джулия оказалась очень интересным языком, богатство структур данных завораживает. А еще тащусь от того, что переменные можно именовать, используя буквы греческого алфавита. Ну и скорость, безусловно

на очереди — мотивация

инженеры оказывались на шаг впереди философов. Декарт, говорят, пришел к идее рефлекса, столкнувшись с автоматизированными статуями в королевском саду. Неизвестный инженер изобрел механическую нифму, которая пряталась в кустах при приближении человека. Ринат был так впечатлен этим изобретением, что уподобил человека этой бездушной машине (инженер на такое не претендовал, по-видимому).
Мы лучше понимаем, как нечто устроено в природе, когда перед нами возникает цель решить ту же задачу, что решала и она в свое время. Разработчики компьютерных игр, наконец, пришли к необходимости подарить мотивацию своим искусственным созданиям, чтобы игры стали более интересными и реалистичными. В одной из свежих монографий они предлагают в первую очередь обратить внимание на мотивы достижений, аффилиации и власти. Именно они, по мысли автора монографии, помогут разворачивать у персонажей поведение, направленное на развитие компетентности, выстраивание отношений, лидерство и контроль ресурсов. Наконец-то инженеры взялись за темы, которыми раньше занимались лишь гуманитарии
На Аваксе решили убрать рекламу и ввести оплату за пользование ресурсом. Плюнул и заплатил 20 долларов, потому что уж очень привык получать доступ к современной литературе
Поиграемся в преподобного Байеса. Где-то в фб проскакивала информация, что умные люди (якобы) обладают выраженной способностью к соленому словцу. Играться с этим фактом с опорой на теорему Байеса проще всего с помощью Экселя. Сначала введем формулы в ячейки следующим образом:

в А4: ="вероятность(" & B1 & ", если " & B2 & ")"
в А5: ="вероятность(" & B2 & ", если " & B1 & ")"
в А6: ="вероятность(" & B1 & ")"
в А7: ="вероятность(" & B2 & ")"

Наконец, в ячейке В4 — самое важное, таинственное и глубокое: =B6*B5/B7

Теперь осталось ввести числа в ячейки В5-В7, чтобы получить ответ на вопрос, какова вероятность того, что человек умный, если он ругается матом? Ну все, приятных интеллектуальных развлечений
интересная вышла штука, пока не могу осмыслить всех ее следствий. Попробовал составить перечень конкретных иследовательских вопросов, которые можно поставить при использовании многоуровневой регрессии. Самый простой, не предполагающий специальной схемы сбора данных: человек отвечает на ряд вопросов, относящихся к одному фактору. Для каждого вопроса у нас известна степень насыщенности фактором (нагрузка, к примеру, или экспертная оценка). На индивидуальном уровне можно построить регрессию ответа в зависимости от насыщенности. Так вот, выяснилось, что величина наклона этой линии регрессии чрезвычайно сильно коррелирует с факторным баллом — порядка 0.995 (правда, все зависит от степени дифференциации меры насыщенности). Попробовал вместо величины нагрузок взять случайный вектор чисел. Выходила какая-то чертовщина: корреляция с факторным баллом даже на громадных выборках оказывалась весьма существенной, причем с разным знаком. После экспериментирования на различных моделях пришел к выводу, что придуманная мера оказывается настолько чувствительной, что даже незначительная корреляция с истинной насыщенностью усиливается в несколько раз. Хм...
Бьюсь тут над одной задачкой для статьи, пытаюсь предсказать реальное поведение студентов. Пришла в голову вот такая идея алгоритма анализа данных: предсказывая некоторое событие, мы последовательно отбрасываем те наблюдения, для которых значения предиктора делают событие маловероятным. Процесс повторяется для оставшихся предикторов, пока насыщенность группы целевыми наблюдениями не перестанет расти. Как говорил Шерлок Холмс: "Отбросьте всё невозможное, то, что останется, и будет ответом, каким бы невероятным он ни оказался". С одной стороны, похоже на то, как работают деревья принятия решений, но здесь гораздо больший вес имеют ограничения (принцип "сломанной ноги")
Встретилась в сети любопытная публикация: Suitbert Ertel, Factor Analysis: Healing an Ailing Model. Автор яростно критикует принцип простой структуры в факторном анализе как вредный и не соответствующий эмпирической реальности. Вместо него он предлагает использовать противоположный критерий - сложной структуры. Факторы нужно вращать так, чтобы матрица факторного отображения получалась как можно более сложной (т.е., каждая переменная нагружалась бы на как можно большее число факторов). Для этого был разработан особый метод вращения варимин, который есть в R пакете GPArotation. Попробовал его на привычном массиве bfi, вышло, гм, действительно сложно. Первый фактор интерпретировался легко, явно вышла на первый план социальная желательность. С последующими факторами все не так очевидно. Кто хочет попробовать свои силы?

require(psych)
require(GPArotation)

data(bfi)
model <- fa(b5[1:25], nfactors = 5, fm = "pa", rotate = "varimin")
labs <- as.character(bfi.dictionary$Item)[1:25]
dimnames(model$loadings)[[1]] <- strtrim(labs, nchar(labs)-1)
print(model, cut = 0.1)

интерес и ангедония

подумалось вдруг, что снижение способности испытывать интерес, которое повсеместно наблюдаю у окружающих - это следствие психического расстройства под названием "ангедония". Ангедония проявляется в том, что человек не испытывает удовольствия от жизни - еды, общения, работы и секса. Этот симптом встречается при многих психологических заболеваниях, включая депрессию и пост-травматическое стрессовое расстройство. Интересно, что по данным европейского социального исследования Украина занимает почти последнее место в Европе по такой ценности, как гедонизм (последними неожиданно оказались Польша и Словакия). Да, наша жизнь - это череда микро и макрострессов, которые накапливаются и приводят к депрессии. Однако и ценностные установки играют немаловажную роль. Мы твердо убеждены, что получать удовольствие от жизни есть грех (особенно если это делает кто-то другой)
чаще всего при проведении факторного анализа в отечественных исследованиях сохраняют факторные баллы, а потом изучают, как они коррелируют с внешними переменными (например, социально-демографическими). Однако факторные баллы - всего лишь оценки возможных значений факторов, при их вычислении имеет место неустранимая неопределенность. Более коректный способ установления связи между факторами и переменными, которые не участвовали в факторизации, опирается на extension analysis (распространительный анализ). Для его проведения нужно знать, как внешние переменные коррелируют с факторизованными. В пакете psych имеется специальная функция fa.extension(), при помощи которой можно получить оценку нагрузок внешних переменных на ядровые факторы, минуя этап вычисления оценок факторных баллов. Вот пример, каким образом выясняется связь пола с факторами Большой Пятерки на массиве bfi из этого пакета:

require(psych)
data(bfi)

b5 <- na.omit(bfi)
model <- fa(b5[1:25], 5, rotate="varimax", scores="regression")

roe <- cor(b5[1:25], b5$gender)
fa.extension(roe, model, FALSE)

Можно сравнить с корреляциями пола и оцененных факторных баллов, ясно видны некоторые отличия (пусть и не очень большие)
cor(b5$gender, model$scores)

Tags:

Profile

alexwin1961
Александр Виноградов

Latest Month

February 2017
S M T W T F S
   1234
567891011
12131415161718
19202122232425
262728    

Tags

Syndicate

RSS Atom
Powered by LiveJournal.com
Designed by Naoto Kishi