Wpis
Zaniedbałem się ostatnio w śledzeniu nowych postępowań, więc rzuciłem się na poszukowanie nowych wpisów w naukach humanistycznych. I rzeczywiście, co chwila znajdowałem monografię z Łodzi, Gdańska, Bydgoszczy (nie mówiąc o miastach, ktore nie są stolicami województw), a wszystkie ze znacznym wpływem na rozwój wielu dyscyplin. Historia, literaturoznawstwo, językoznawstwo, wszystkie rozwinęły się znacznie po opubliowaniu tych wiekopomnych zapewne dzieł. Jednak po raz kolejny zwróciło moją szczególną uwagę to, że habilitanci co rusz podają w autoreferatach recenzentów wydawniczych książek. I po raz koleny mnie ta praktyka zastanowiła.
Zastanowiło mnie to, że habilitanci podają te nazwiska. Przecież recenzent wydawniczy (co już dawno temu zauważał podworkowy) ocenia książkę inaczej niż recenzent habilitacyjny. To, że książkę warto wydać, wcale nie musi oznaczać, że powinna być podstawą nadania stopnia. Moe być przecież książka dobrym przeglądem badań, może być ciekawie napisana, możemy liczyć na to, że dobrze się sprzeda. Te wszystkie cechy nie mają jednak większego znaczenia w ocenie książki przecz recenzenta habilitacyjnego. Nazwiska recenzentów wydawniczych mają więc pewnie funkcję rzucenia ważnym nazwiskiem w nadziei, że mniej ważny recenzent habilitacyjny nie będzie się chciał przeciwstawić.Tak jak się mówi, że się zna Rycha, Zbycha, małego Czarka i grubego Benka. Ot, polska habilitacja.
Zastanawiałem się też nad tym, że wydaje się być powszechne to, że autorzy znają swych recenzentów. Potem jednak uświadomiłem sobie, że niejednokrotnie widziałem nazwiska recenzentów wydrukowane w książkach. Trochę mnie ten zwyczaj dziwi. Po to właśnie recenzenci są anonimowi, by nie musieli martwić się o wszelkie układy i układziki, które, chcąc nie chcąc, muszą wpływać na to, jaka jest ostateczna forma recenzji. Ot, polska humanistyka.
Zdziwiłbym się, gdyby recenzentów wydawniczych wybierał ktokolwiek inny niż habilitant/profesorant. Mogę sobie nawet wyobrazić, że w wielu przypadkach to on ich opłaca. Wyjątek gotów jestem zrobić dla renomowanych wydawnictw, ale tylko wtedy, gdy na wydanie monografii dostaną dotację. W końcu biznes to biznes!
Autentyczna rada wydawcy mającego kontakt ze środowiskiem naukowym: "Pan dostarcza manuskrypt i 2 recenzentów, ja daję ISBN i książka habilitacyjna gotowa!".
Jeden recenzent wystarczy. I tak recenzje wydawnicze sa na sztukę tylko po to by punkty za książkę były.
może i tak jest czasami
W niektórych krajach aby książka liczyła się jako monografia - nazwiska 2 recenzentów muszą być wymienione na początku.
U nas i w komercyjnych wydawnictwach w ktorych ksiazki wydawalem (bez dotacji) zawsze wydawca oplacal recenzentow i na wybor recenzentow nie mialem wplywu. W uczelnianym wydawnictwie wręcz wybrano ich pod kątem tego aby byli mi obcy i aby byli znani z tego, że między nimi a moim szefem jest raczej chłodno - bez mięty. Uzasdniając, że jak oni to puszczą, to już nikt po nich nie będzie się niczego dopatrywał. Może o to chodzi z tym ujawnianiem? Recenzenci wiedzą, że to ma być książka profesorska lub habilitacyjne osiągnięcie i tak recenzują.
Drobna uwaga, kilkukrotnie bylem proszony przez dobre miedzynarodowe wydawnictwa o to, by sugerowac recenzentow. Czy wydawnictwa korzystaly z tych sugestii, nie mam pojecia, recenzje byly anonimowe. Wielokrotnie tez pisalem recenzje wydawnicze,, zawsze rowniez anonimowo.
Oczywiscie, gdy pisze sie recenzje dobrej ksiazki, latwo jest ja pisac i to pod swoim nazwiskiem. Gdy sie pisze negatywna recenzje (calej ksiazki, a nie propozycj), to jest to trudne, a trudniejsze z podpisem. Nie chodzi o to, ze ja nie chce si epodpisac pod tym, co pisze. Jednak zdarzylo mi sie pisac recenzje negatywna ksiazki napisanej przez osobe, ktora znalem osobiscie (moze, nie dobrze, ale jednak spotykalismy sie na konferencjach i rozmawialismy ze soba). Pomimo tego, ze recenzje nie sa personalne, to i tak negatywna recenzja musi miec wplyw na relacje miedzy ludzmi. i dlatego lepiej, jak jest anonimowa.
Co do wpsiu - podawanie nazwisk recenzentow wydawniczych jest rzeczywiscie mwoieniem: za mna juz stoi prof Iksinski. I dlatego jest dosc zenujace.
znajomy w nowym trybie dostal obu wydawniczych recenzentow jako czlonkow recenzentów komisji habilitacyjnej - wlasnie dlatego, ze ujawnil ich w autoreferacie i we wniosku
Ale my tu nie dyskutujemy o "dobrych międzynarodowych wydawnictwach" tylko o podwórku lokalnym nawet w skali Polski; co chwila znajdowałem monografię z Łodzi, Gdańska, Bydgoszczy (nie mówiąc o miastach, ktore nie są stolicami województw), a wszystkie ze znacznym wpływem na rozwój wielu dyscyplin.
Weźmy kogoś, kto merytoryczną część autoreferatu (prawo) zaczyna od następującej tezy:
W wyniku przeprowadzonych badań ustaliłem, iż źródeł idei władzy ludu można doszukiwać się w rozwiązaniach ustrojowych starożytnej Grecji i Rzymu
Jeśli takie odkrycia są w autoreferacie, to cóż dopiero musiało się znaleźć w monografii! I przeszło, a habilitant zajął pozycję decyzyjną i to nie w administracji nauką, tylko w samej nauce.
@trzy.14
Po tym co napisałeś wynika, że fakt że autoreferaty na stronie CK są udostępniane w wersjach nieprzeszukiwalnych jest po prostu zbrodnią.
No ale wtedy Nauka Polska mogłaby zostać ośmieszona przez byle dziennikarzynę z googlem, a tak musi ktoś te autoreferaty czytać.
Pi, jasna sprawa. I takich ksiazek, ktore ustalaja po przeprowadzeniu doglebnych badan, ze ksiazki sluza do czytania, jest bardzo, bardzo wiele.
ale, dla porzadku, rowniez w polskich książkach znajduja sie rzeczywiscie dobre badania. niedawno zreszta pisalem recenzje doskonalej ksiazki po polsku. Najwyrazniej zreszta wydanej po polsku, zeby sie recenzenci habilitacyjni odpieprzyli.
Zamiast naśmiewać się z zamieszczania nazwisk recenzentów wydawniczych w autoreferacie, lepiej może najpierw sprawdzić, jak wygląda wzór autoreferatu zamieszczony na stronie ck
www.ck.gov.pl/images/PDF/komunikaty/wzor_autoreferat.pdf
punkt 4b.
@jwf Przepraszam, nie widziałem tego. Nie potrafię tego sensownie skomentować.
Załącznik do Zarządzenie nr 33 Rektora Politechniki Białostockiej z dnia 13 marca 2009 roku.
§3
5. W pierwszej kolejności powinny być wydawane publikacje mające bezpośredni wpływ na awans naukowy pracowników Politechniki Białostockiej, a w szczególności rozprawy habilitacyjne.
§8
3. W opinii wydawniczej monografii recenzent powinien określić wkład autora do rozwoju danej dyscypliny naukowej. W opinii rozprawy habilitacyjnej powinno się także znaleźć jednoznaczne stwierdzenie, że recenzowana praca spełnia wymogi rozprawy habilitacyjnej.
Czy ktoś, kto recenzował monografie habilitacyjne, mógłby rozjaśnić, jaka jest rola recenzenta wydawniczego monografii habilitacyjnej wydawanej w uczelnianym wydawnictwie?
a) quasi-recenzent habilitacyjny
b) osoba zaświadczająca, że dana książka to nie jest humbug, czyli ktoś, kto dba o interes finansowy wydawnictwa/uczelni.
Żądanie CK wskazuje, że poprawną odpowiedzią jest a)
Zarządzenie Rektora bliższe jest odpowiedzi b)
Z tym, że punkt b) prościej byłoby załatwić pismem od dziekana, natomiast punkt a) to jawne bezprawie i gotowy przepis na mobbing w białych rękawiczkach. Ponawiam więc pytanie: jaka jest rola recenzenta wydawniczego monografii habilitacyjnej wydawanej w uczelnianym wydawnictwie?
Pi, musze powiedziec, ze ja sie tez nad tym zastanawialem. I wbrew temu, co zarzadil rektor, nie jestem pewien, czy o to chodzi.
Sprawa finansow jest poza kwestia - przecie te ksiazki czesto wydawane sa z jakichs grantow itd. Wydawnictwo nie ponosi zadnego ryzyka finansowego. Umowmy sie tez - trudno mowic o jakims ryzyku reputacyjnym. Ile ksiazek uniwersyteu w bydgoszczy czytales ( nie mowiac juz o Kutnie czy Siedlcach)? I czy humbug wydaniczy zmieni twoje praktyki czytelnicze?
No chyba ze chodzi o jakies tresci niezgodne z prawem, szkalujace kogos...ale wtedy to powinien czytac prawnik?
Nawiasem mowiac, ladnych pare lat temu widzialem ksiazke wydana przez wydawnictwo w Siedlcach. Oni nawet spell-checku nie zrobili! Ta ksiazka byla straszna! Blad za bledem. Mialo sie wrazenie, ze oni wydrukowali wprost to, co dostali od autora, a autor zapomnial zrobic spellchecku ostatniej wersji. I co? myslisz, ze Siedlce UP press sie rozpadlo przez to?
I pozostaje konkluzja, ze rola recenzenta wydawniczego jest pokazanie, ze jego/jej wlocznia stoi po dstronie habilitanta :)
Nikt nie wziął pod uwagę tego, że wybór recenzenta wydawniczego może być też podyktowany chęcią wyeliminowania go z grona recenzentów habilitacyjnych, a jego krytyczne uwagi podnieść wartość rozprawy
Paker podal bardzo wazny powod wyboru recenzenta wydawniczego. Cala seria monografii habilitacyjnych w zaprzaznionym osrodku byla recenzowana przez pewna pania profesor, o ktorej mowiono, ze "czepia sie". Faktycznie czepia sie bez sensu zupelnie, wiec lepiej bylo jej unikac jako recenzenta habilitacyjnego. Ale to wszystko zalezy od lokalnych ukladow. Znam tez calkiem liczne przypadki powolywania recenzenta wydawniczego jako habilitacyjnego.
Czyli recenzent wydawniczy nie jest wybierany przez wydawnictwo?
Nie. Zazwyczaj do garażu przychodzi się drukować z własnym recenzentem.
Ale chyba nie trzeba ciągać biednego recenzenta po garażach - nie wystarczy jego nazwisko na stronie redakcyjnej?
Tymczasem na AGH...
List jednego profesora do uczelnianego kolegium elektorów
@adam_beast
Oj tam, oj tam. Zwykły gry i zabawy ludu polskiego przed kolejnymi wyborami mistera najbardziej odjechanych obietnic.
Rzućmy natomiast okiem retrospektywnie (link) przypominając sobie co ciekawsze uwagi sprzed pięciu lat:
...o, że za pięć lat polskie uczelnie, albo przynajmniej choć jedna z nich, trafią do pierwszej setki światowych rankingów, wydaje mi się po pierwsze niemożliwe, a po drugie niepotrzebne.
Celem uczelni wyższych w Polsce powinno być teraz kształcenie ludzi, którzy mają kształcić kolejnych. (...) Największym skandalem i wstydem polskiego szkolnictwa wyższego jest bowiem fakt, że po 20 latach, w ciągu których przybyło 1,5 mln studentów, liczba nauczycieli akademickich pozostała niezmieniona i wynosi 60 tys...
Coś się zmieniło? Nic. Obecne wybory rektorów też nic nie zmienią, bo ten system jest zagłodzony finansowo do granic egzystencji.
I nie zgodzę się tu z niektórymi reformistycznymi progresistami, że najpierw reformy, a dopiero potem kasa. Bo potem już nic nie będzie. Ani nikogo. Tak jak u tego żałosnego Kononowicza...
@pi - rzecz jasna nie chodziło mi o schodzeniu do garażu fizycznie z recenzentem, ale z wyznaczonym recenzentem. Normą jest też w wielu wydawnictwach, że przyjmuje się manuskrypt od razu z recenzjami. Szast prast, faktura i drukarki ładują egzemplarze autorskie oraz wydania dla BN i przyszłej komisji habilitacyjnej.
@staryzgred2012
Zgoda, kasy jest za mało. Ale, po pierwsze - na co nam 1,5 mln studentów, 60 tys. doktorantów itd., po drugie - nie sądzisz, że ten system potrafi wchłonąć dowolną ilość kasy, jako wynik dając to samo co teraz?
W przytoczonym przez adam_beast'a dokumencie wymienia się z nazwiska 4 osoby, pełniące funkcje:
- obecnego rektora AGH
- byłego rektora AGH
- członka rzeczywistego PAN
- trzech członków CK, w tym przewodniczącego CK i wielokadencyjnej diamentowo-szarej eminencji CK
- funkcji dziekańskich aż trudno zliczyć
- przewodniczącego rady nadzorczej Tauronu
- fundatora rzeźby swojej żony na kampusie AGH
Jeden z bohaterów, któremu nie dane było (dotąd) zostać rektorem, członkiem czy przewodniczącym, na swojej stronie napisał:
W ostatnich 15 latach kierowałem 13 grantami badawczymi finansowanymi w ramach Konkursów KBN, MNiSzW oraz NCBiR i NCN. Jestem członkiem grupy ekspertów NCBiR i NCN.
Więc o ile zgadzam się, że pieniędzy jest ogólnie za mało, to w tym konkretnym przypadku problem leży chyba gdzie indziej: ich jest za dużo! I to wokół tych pieniędzy utworzyła się "GTW na AGH".
Prawdopodobnie więc główny problem leży nie w ilości pieniędzy, tylko w tym, jak one przepływają. O ile my tu lubimy wyżywać się na społ-humach, to to, co dzieje się wśród technicznych prawdopodobnie jest jeszcze gorsze - bo społ-humy na naprawdę innowacyjne wałki są po prostu za biedne.
***
Wg OPI, autor apelu wykonał dotąd okrągłe zero recenzji doktorskich i habilitacyjnych.
***
Gdyby więc , jak pisze adam, autoreferaty (szerzej: dokumentację awansową) umieścić w wersji przeszukiwalnej, można by dość szybko dojść do tego, czy (a raczej: gdzie) istnieją Grupy Trzymające Recenzje. Jeśli się tego nie robi, oznacza to, że te grupy trzymają też CK.
@trzy
Jeśli baza zostałaby udostępniona w wersji przeszukiwalnej osoba potrafiąca jedynie pisać skrypty przetwarzające tekst w kilka minut mogłaby zdobyć wiedzę o zależnościach w nauce polskiej które samodzielnie poznaje się latami. Ze wszystkich dziedzin. I jeszcze je ładnie zwizualizować.
@Pi,
A jak tam z cytowalnością i "dorobkiem" na podstawie tych grantów? (ja rozumiem, że to NIE ON pisał, że miał murzynów, ale ciekawi mnie, co z tych 15 grantów wynikło dla nałki).
@trzy.14
> Gdyby więc , jak pisze adam, autoreferaty (szerzej: dokumentację
> awansową) umieścić w wersji przeszukiwalnej
Hm, ile jest łącznie takich postępowań do przejrzenia? W końcu wystarczy zassać serwer CK, podzielić się robotą, a potem wygenerować bazę przeszukiwalną.
Taaaaki Paryż chyba jest wart mszy?
nobbynooby,
21 dokumentów i 25 cytowań w Scopus (całość dorobku, z wykluczeniem samocytowań współautorów).
Wykazałem się czujnością rewolucyjną i kliknąłem w te 25 artykułów, po czym wykluczyłem te, które mają polskie afiliacje. Zostało 10. Wszystkie z lat 2013-2015, co świadczy o systematycznym rozwoju naukowym analizowanej osoby. W sumie mogłaby objąć już jakieś przewodniczenie albo choćby członkostwo.
Zafrapowany tym odkryciem, jak przystało na pracownika nauki (jak to brzmi!), postawiłem hipotezę badawczą: reformy Kudryckiej wpłynęły na sposób publikowania nawet na AGH i stąd pojawienie się zewnętrznych cytowań w 2013.
Faktycznie, z indeksowanych 21 artykułów, aż 15 opublikowano w latach 2012-2015 (4 rocznie). Pozostałe 6 zostało opublikowanych w latach 2002-2011 (2/3 rocznie).
Uzyskany tytuł profesora: 1996
Mamy 3 kolejne hipotezy badawcze, na które nie znam odpowiedzi:
a) w roku 2012 lub 2011 nastąpił skokowy przyrostu umiejętności badawczych szefa
b) w roku 2011 lub 2012 nastąpił skokowy przyrost zdolności publikacyjnej szefa (np. poprzez dołączenie do kolegium redakcyjnego pisma z LF)
c) w roku 2012 lub 2011 w zespole szefa pojawił się jakiś młody Rudek
zgred, nie mam oprogramowanie do OCR-owania tych PDF-ów. Szczerze, to kiedyś próbowałem (!), ale z tego, co mam (niekomercyjne), wychodziła sieczka. Gdyby pdf-y były generowane z tekstu (np. przez word), średnio zdolny magistrant a może i licencjusz dałby radę.
Jednak google potrafi wgryźć się w te pdf-y (wydaje mi się, że potrafi indeksować zawartość przynajmniej części z nich), więc to tylko kwestia jakości posiadanego OCR-a...
Na pewno można zassać i przeanalizować dane z OPI, ale potrzeba jakiegoś rozgarniętego magistranta, żeby z tym potem coś zrobił. OPi ma jednak wiele wad (niepełność bazy, brak informacji o negatywnych postępowaniach, niezwykła szczupłość informacji o postępowaniach profesorskich, które wydają się kluczem).
Natomiast kilka osób razy kilka godzin pracy powinno być w stanie udowodnić "hipotezę naukową": w każdym postępowaniu z ekonomii uczestniczy członek CK.
@pi
hipotezę "w każdym postępowaniu z ekonomii uczestniczy członek CK" mozna oczywiscie wryfikowac doswiadczalnie, ale to tylko w odniesieniu do "uczestniczył".
Mozna wszakze ja po prostu udowodnic:
- do CK wybiera sie ekonomistow najlepszych
- najlepsi ekonomisci licza najlepiej wlasne dochody
- uczestniczenie w postepowaniach jest platne
Nie wiem, czy to trzeba OCR-ować. Jeśli chce się po prostu zbadać składy komisji i konkluzje recenzji to zrobienie tego automatycznie może być problematyczne, jeżeli dokumenty mają różne szablony. Moim zdaniem najwygodniejszy do przetwarzania byłby CSV z podstawowymi danymi:
Imię i nazwisko kandydata,
Jednostka w której pracuje kandydat,
Jednostka, w której odbywa się postępowanie,
Imię i nazwisko przewodniczącego,
Imię i nazwisko recenzenta 1,
Imię i nazwisko recenzenta 2,
Imię i nazwisko recenzenta 3,
Imię i nazwisko członka komisji 1,
Imię i nazwisko członka komisji 2,
Imię i nazwisko członka komisji 3,
Czy konkluzja recenzji 1 była pozytywna
Czy konkluzja recenzji 2 była pozytywna
Czy konkluzja recenzji 3 była pozytywna
Czy nadano habilitację
Działa, pod warunkiem, że imiona i nazwiska są unikalne.
Do udowodniania hipotezy o której pisał @trzy trzeba zrobić słownikową CSV-kę z danymi recenzentów
Imię nawisko,
Afiliacja,
Członek CK,
inne ważne członkostwa...
Czy coś pominąłem?
@Pi
Hipotezę #3 łatwo sprawdzić, testując pozostałych współautorów na wcześniejsze z tą osobą publikacje. Wiem na własnej skórze, że [a="pokazywarka.pl/n6oxvv/]jedna osoba robi różnicę[/a] (dołączyłem do zespołu mojej szefowej w końcu 2010r.).
Bardzo dziękuję za dane!
nobby, nie masz dostępu do Scopusa? Jakim cudem?
@Pi,
Piszę z domu; na domowym nie mam zapamiętanego hasła.
@cutbold
To może poprostu postawić anonimowy dokument na google docsach i zaczac to robic.
Problem jest z nowymi danymi - CK w żaden sposób nie porządkuje danych, które przybyły. Z tego powodu jak się raz zassa zawartość to potem ciężko ogarnąć jakie postęowania się później pojawiły.
nobby,
Przecież ja też piszę z domu... Do Scopusa mam dostęp poprzez VPN zorganizowany przez bibliotekę główną mojej uczelni; alternatywą jest wydziałowy VPN. Dzięki temu można pracować w domu jakby siedziało się na uczelni.
Zgred,
ten cytat z "Polityki" bardzo dobry, tylko że autorka w jednym miejscu przestrzeliła: celem edukacji wyższej nie jest kształcenie nauczycieli! Wolę wczorajszego Guardiana
Only students who dont need jobs can afford an education that does not prepare them for the workplace, and very few are in this position. Getting a good job is consistently given in student surveys as the main motivation for going to university, and students expect a professional degree to prepare them for their chosen profession. This is as true in law, engineering, architecture and medicine as it is in nursing, education or management.
...
For example, at the University of Waterloo in Canada, all 14 of their undergraduate engineering programmes involve up to two years working in industry.
Cholera, jak ja mam studentów przygotować do pracy zawodowej, skoro nigdy nie pracowałem poza sektorem akademickim?
@Pi,
Informatyków pytałem o VPN już w 2011r. (uniwerek w USA, z którego właśnie wracałęm, zapewniał VPN na defaulcie). Usłyszałem, że takie rzeczy tylko w Erze... a nie w naszym Instytucie. Widzisz, nie pozwalają nam pracować z domu :) Dobrze, że udało się założyć konto na JCR...
@Pi
No to mamy z JCR. Już więcej nie spamuję.
Ja bym wzrost cytowań korelował nie tyle wprost z reformą Kudryckiej tylko z zasadami oceny wniosków w NCN.
@adam_beast
> Problem jest z nowymi danymi - CK w żaden sposób nie porządkuje
> danych, które przybyły. Z tego powodu jak się raz zassa zawartość
> to potem ciężko ogarnąć jakie postęowania się później pojawiły.
wget jest w stanie zassać całą strukturę raz, a potem robić przyrosty różnicowe.
@trzy.14
> celem edukacji wyższej nie jest kształcenie nauczycieli!
> (...)
> Cholera, jak ja mam studentów przygotować do pracy zawodowej,
> skoro nigdy nie pracowałem poza sektorem akademickim?
Tu nie ma sprzeczności. Jej właśnie o to chodzi! Celem edukacji WYŻSZEJ jest kształcenie nauczycieli. Dobrze przygotowanych nauczycieli ZAWODU. A nie mędrkujących sfrustrowanych filozofów.
Jak masz przygotować? Idąc na rok do PRACY ZAWODOWEJ. Nie edukacyjnej. Nie naukowej. Ale ZAWODOWEJ. Zbierasz doświadczenia. Potem wracasz i teoretyczne mędrkowanie filtrujesz przez swoje doświadczenie. Odrzucasz nieistotne bzdety, pozostawiasz esencję.
Ja ze współpracy z przemysłem, na poziomie eksperckim, nie naukowym, wyciągam dwie korzyści: finansową, ale przede wszystkim DOŚWIADCZENIE. Tego nie zastąpi żadne kiszenie się w sosie własnym. Z uwagi na to, że u nas w zasadzie nie ma zaplecza przemysłowego na wysokim poziomie naukowym to na razie, w horyzoncie ok. 10...20 lat powinniśmy się skupić właśnie na DOBREJ i ELITARNEJ dydaktyce zawodowej. Z dominującej części plebsu tresowanego na "studiach" licencjackich nie będzie żadnego pożytku. Niestety, ale trzeba wrócić do studiów WYŻSZYCH jako selekcji górnego odsetka intelektualnego społeczeństwa. Wiem, że to jest niepopularne politycznie, ale inaczej po prostu się nie da! Nauczanie na poziomie przyswajalnym dla 30...50% populacji jest nauczaniem ŚREDNIM!
@Pi
No to mamy z JCR. Już więcej nie spamuję
Proszę powiedziec dla czego te wyniki? dla jednej osoby czy dla calej uczelni AGH lub innej - jakiej?
@nobbynooby
> Informatyków pytałem o VPN już w 2011r. (uniwerek w USA, z którego
> właśnie wracałęm, zapewniał VPN na defaulcie). Usłyszałem, że takie rzeczy
> tylko w Erze... a nie w naszym Instytucie.
To na szybko ściągnij sobie komercyjnego TeamViewera, odpal i zostaw na pracującym komputerze w pracy, a potem podłącz się drugim TeamViewerem z domu. Tym można wyjść zza NAT-a i firewalla, o ile nie ma jakichś "admino-faszystowskich" ustawień. Ale sądząc po braku VPN, to admini z Twojego instytutu raczej nie są na tym poziomie.
@klamczuch,
To była kontynuacja poprzedniego wpisu, z danymi ze ScholarGoogle. Poprzez pokazanie, że jedna osoba może zrobić różnicę (yours truly), odnosiłem się do hipotezy #3 Pi, że być może ten jego CiekawyGranciarz też pozyskał podobnego murzyna do rozliczania grantów. Dane dotyczą mojej szefowej, FullProf. (ostatni gwizdek starego trybu).
@Zgred,
DZIĘKI; ciekwaych rzeczy się tu uczę ;) wget, teraz TeamViewer. ^^.
@adam_beast
Jeżeli chodzi ci o aktualizowanie danych, które są uzupełniane na stronie CK można po prostu mieć ostatnią listę osób i sprawdzić, czy na stronie nie przybyło nowych nazwisk.
To jest lista wszytskich osób które są na stronie CK w dziedzinie nauk humanistycznych.
s000.tinyupload.com/index.php?file_id=56151693262166135593
Porównanie i ściągnięcie wykonuje się stosunkowo szybko.
Jak widać osób jest 931.
Z mojej strony mogę dowolnie parsować stronę CK i ściągnąć dane, które są na niej dostępne. Ściąganie lokalnej kopii pdf-ów nie ma sensu (dla 150-ciu osób było już tego ponad giga). Trzeba by to było opracować na podstawie danych online.
Jeśli jest na to zapotrzebowanie społeczne ;-) mogę "po godzinach" częściowo wyczyścić dane (jak jakieś będą) i zrobić analizę grafów powiązań pomiędzy osobami biorącymi udział w postępowaniach, powykrywać klastry itp.
Moim zdaniem OCR tu nic nie da - jeśli są Państwo tym zainteresowani, trzeba niestety przejrzeć te postępowania i uzupełnić CSV-kę.
@cutbold
> Moim zdaniem OCR tu nic nie da
Zgadza się. Niezbędne będzie "rękodzieło", bo ktoś "inteligentny inaczej", na samym początku "reformy" Kudryckiej/Woźnickiego nie wpadł na pomysł, aby wykorzystać istniejący w OPI system OSF obsługujący granty MNiSW/NCN, który po minimalnych modyfikacjach mógłby kompletnie obsłużyć CK w zakresie doktoratów/habilitacji/profesur. Zamiast kuriozalnych pdf-owych skanów graficznych mielibyśmy normalne pliki nadające się do analiz treściowych.
Ostatnim momentem, w którym można było jeszcze "uratować" stronę CK było inne zaprojektowanie wgrywania plików z postępowań oraz lekka modyfikacja bazy danych. Nie widziałem interfejsu tej strony, ale widać, że do wgrywania jest formularz i informacje o poszczególnych plikach są w bazie (świadczy o tym posortowana lista postępowań według nazwisk). Każdy z rekordów bazy można najprawdopodobniej edytować dodając / modyfikując pliki na serwerze (świadczą o tym podkatalogi z literówkami w nazwiskach w ramach jednej osoby). Na tym etapie wystarczyłoby wymóc poprzez interfejs na osobie, która wprowadza dane, aby opisywała każdy plik, np. że jest to recenzja zrobiona przez taką - a - taką osobę, która wpłynęła danego dnia. Do postępowania można by dodać informację, gdzie się odbywało i z jakim skutkiem. Skład komisji to tylko 7 nazwisk. Jakby to robić na bieżąco dodanie jednego wpisu trwało by może 5 minut a nie 2. Nie chce mi się wierzyć, że nikt nie pomyślał o dodaniu najprostszych metadanych (może są, ale nieudostępnione?). Moim zdaniem koszt wytworzenia aplikacji wzrósłby nieznacznie a dawało by to na przyszłość perspektywy rozbudowania serwisu i możliwość centralnego (!) panowania nad wszystkim przez analizę danych historycznych. W obecnej postaci strona jest zupełnie niefunkcjonalna.
@staryzgred2012
Podejrzewam, że zrobienie aktualnej strony CK było dużo tańsze niż dorobienie funkcjonalności o której mówisz do OSF. Być może na stronie CK robi się jeszcze więcej rzeczy ręcznie i to jest jeden z powodów, dlaczego tak wolno pojawiają się tam aktualizacje postępowań?
@cutbold
> Podejrzewam, że zrobienie aktualnej strony CK było dużo
> tańsze niż dorobienie funkcjonalności o której mówisz do OSF
Wątpię. Zwróć uwagę, że typowy wniosek doktorski/habilitacyjny/profesorski NICZYM strukturalnie nie różni się od wniosku grantowego. Recenzje - tak samo.
Całość modyfikacji sprowadzałaby się tylko do zmiany tytułów poszczególnych pól tekstowych.
W OSF jest jakiś CMS na podstawie którego buduje się odpowiednie moduły. Pytanie, czy szablony buduje ktoś zatrudniony "na etacie" czy zleca się to firmie. Jeśli firmie, to nie jest to tanie (choć w sumie nie wiem czy nie tańsze niż utrzymanie pełnoetatowego pracownika...).
Z drugiej strony zrobienie strony, której jedyną funkcjonalnością jest zapytanie do bazy danych, które zwraca posortowane wyniki nie wymaga wielkich kosztów. Jeśli w zeszłym roku problemem było hostowane być może ze 50 GB danych, coś może być na rzeczy.
Masz w pełni rację - zrobienie tego w ramach OSF było by dobrym rozwiązaniem. Ciekawe tylko, jak wyglądałaby dostępność danych - czy tak jak obecnie w grantach?
Zgred ma rację.
Całą dokumentację powinno się przygotowywać w systemie podobnym do tego, jaki obowiązuje przy składaniu wniosków grantowych. CAŁĄ. Włącznie z recenzjami i decyzją RW. I protokołem z posiedzenia KH!!! Przygotowanie takiego systemu byłoby stosunkowo tanie, bo klocki są gotowe. Oczyma wyobraźni widzę nawet osobne pole na wpisanie nazwy wydawnictwa, które wydało monografię habilitacyjną/profesorską :-) Nie wiem, czy znalazłby się odważny we władzach, który by miał śmiałość zbadać statystycznie taką bazę.
Transparency, accountability, integrity.
Dlatego ta baza powinna być całkowicie jawna z opcją hurtowego eksportu w formacje CSV.
Popytalem google'a i znalazlem strone www.freeocr.net/
Program tam umieszczony bazuje na silniku tesseract rozwijanym przez google'a
(github.com/tesseract-ocr/tesseract) i moim zdaniem zupelnie przyzwoicie sobie radzi. Przyklad przerobionego dokumentu o powolaniu komisji: s000.tinyupload.com/index.php?file_id=11964668281852946145
Trochę nie mam teraz czasu żeby się tym zająć, ale myślę, że jeśli przez miesiąc nikt nic nie zrobi to postaram się przygotować program/skrypt przynajmniej częściowo wypełniający tabelę cutbolda.
@Cutbold
Jak wygenerujesz analogiczną listę mogę w wolnej chwili zająć się naukami technicznymi, których mam spory kawałek na dysku. Przy okazji, czy nie sądzicie, że należałoby dodać jeszcze pole "Dyscyplina"? To też mogłoby coś powiedzieć.
Stan na marzec zeszłego roku w dziedzinie ekonomia, kiedy groziło wyczyszczenie serwera CK i zrobiłem prywatny mirror ekonomii.
Liczba plików zal2.pdf (decyzja CK o powołaniu recenzentów): 119
Liczba plików zal2.pdf, które poddały się wizualnie rozsądnej obróbce OCR: 118
Liczba wystąpień słów kluczowych:
Romanowska/Rcmancwska: 47
Jajuga: 42
Owsiak: 23
Domański/Dcmański/Domanski: 37+2+1 = 40
Borowiecki: 32
Bratnicki: 16
Czyżewski: 9
Jasiczak: 20
Jurek: 28
Kotowska: 10
Osiewalski: 13
Przybylska: 4
Stryjakiewicz: 10
Wojtyna: 9
Zaleska: 8
Tak na oko średnio w postępowaniu z ekonomii występuje więc nieco ponad dwoje członków CK
dla kontroli jakości OCR:
przewodnicz: 112
recenzent: 340
sekretarz: 115
Krak: 159
Pozna: 163
Wroc: 117
Gda: 107
przewodniczący komisji, alfabetycznie, 105 pozycji
prof. Ryszard Borowiecki
prof. Ryszard Borowiecki
prof. Mariusz Bratnicki
prof. Czasław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Czesław Domański
prof. Stanisław Gosiak
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prof. Krzysztof Jajuga
prot Krzysztof Jajuga
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Jan Jasiczak
prof. Witold .Jurek
prof. Witold .Jurek
prof. WItcld Jurek
prof. WItcld Jurek
prof. Witold Jurek
prof. Witold Jurek
prof. Witold Jurek
prof. Witold Jurek
prof. Michał Kobusiewicz
prof. Michał Kobusiewicz
prof. Michał Kobusiewicz
prof. Irena Kotowska
prof. Jan Lichtarski
prof. Jan Lichtarski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Bogdan Nogalski
prof. Jacek Osiewalski
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Stanisław Owsiak
prof. Maria Romanowska
prof. Maria Romanowska
prof. Maria Romanowska
prof. Maria Romanowska
prof. Maria Romanowska
prof. Maria Romanowska
prof. Maria Romanowska
prof. Maria Romanowska
prof. Maria Romanowska
prof. Stanisław üwsiak
prof. Małgorzata Zaleska
prof. Małgorzata Zaleska
prof. Małgorzata Zaleska
Ten prof. Gosiak to musi byc ktoś, skoro dali mu przewodniczenie. Ale nie, może nie mieli mocy przerobowych, bo w tym postępowaniu 2 recenzentów i członek było z CK.
To może prof. Kobusiewicz? Ale to były 3 postępowania z archeologii, które zaplątały się w ekonomii...
To może Lichtarski? Bingo! Jedyne postępowanie, w którym nie uczestniczyli członkowie CK (stan na okres od początku 2012 do mnie więcej 3. kwartału 2014)
@adam_beast
Rzeczywiście, dziedzina się przyda.
Nauki techniczne:
s000.tinyupload.com/index.php?file_id=33058599169334084539
Takim programem to ściągam (C# console application .NET Framework 2.0):
s000.tinyupload.com/index.php?file_id=18080841301515192660
Można nim ściągnąć również pdf-y postępowań, trzeba wtedy odkomentować odpowiednie linijki. Ściągnięcie samych nazwisk to kilka sekund, pdf-ów kilkanaście / dziesiąt minut. Połączenie ze stroną CK może być (i czasem jest...) niezaufane, dlatego wyłączyłem ServerCertificateValidationCallback.
@trzy.14
Poziom obsługi serwera CK jest żałosny. Włącz sobie protokół https. Nie wiadomo, czy się śmiać, czy płakać. Certyfikat przeterminowany pół roku temu, a w dodatku przypisany tylko na domenę, bez aliasu z www.
Do licha, za kilkaset złotych rocznie można mieć o wiele lepszy poziom obsługi w byle hostingu zewnętrznym.
Zgred,
hosting zewnętrzny to firma prywatna; CK to działalność publiczna (=niepełnosprawna). Przecież nie zatrudnią informatyka, który zarabiałby więcej od nich? Jak się kiedyś dowiedziałem, za jaką pensje pracują nasi informatycy, to przestałem się czemukolwiek dziwić.
Mam same załączniki nr 2 dla panelu humanistów w formacie jpg lub tiff. Nazwy plików są takie jak nazwiska osób, których dotyczy postępowanie. To chyba nie są wszystkie postępowania (plików jest 606), ale próbka jest chyba wystarczająco liczna, aby wyciągnąć jakieś wnioski. Podejrzewam, że w Pythonie OCR tych plików zrobi się od ręki.
Jeśli ktoś zna jakiś darmowy - anonimowy hosting, na który nie trzeba się logować i który "łyknie" 200 mega w jednym pliku (nie chce mi się archiwum dzielić na kawałki) mogę udostępnić.
Tu jest próbka ostatniej części:
s000.tinyupload.com/index.php?file_id=03958524668521329907
Nauki techniczne, przyzwoity OCR:
s000.tinyupload.com/index.php?file_id=92708332246187829202
tak można zassać pliki z sekcji CK programem wget: s000.tinyupload.com/index.php?file_id=00760215522383040531
A tak zrobić przyzwoity automatyczny OCR:
s000.tinyupload.com/index.php?file_id=74751914579188224169
(Linux)
@trzy - super!
Ja zrobiłem OCR nauk humanistycznych (załącznik 2)
s000.tinyupload.com/index.php?file_id=78441543424509835667
Pod Windowsa jako OCR polecam
sourceforge.net/projects/tesseract-ocr-alt/files/
pakiet z językiem polskim
packages.ubuntu.com/pl/precise/graphics/tesseract-ocr-pol
plik bat do przetworzenia wsadowego wszystkich skanów
s000.tinyupload.com/index.php?file_id=39751702578060515547
instrukcja, jak go modyfikować
digitalaladore.wordpress.com/2014/11/17/using-tesseract-via-command-line/
@trzy.14, @cutbold
I w ten sposób, zanim nastanie nowy tydzień, CK będzie przerobione do formy parsowalnej. A zanim minie kolejny tydzień wszystkie powiązania koterii, klik i kamaryl będą odsłonięte jak na dłoni.
Oj, to pospolite ruszenie. Takie niepozorne, a takie niebezpieczne.
CSV z nauk technicznych (483 pozycje) zrobiona na podstawie danych od @trzy.14. Należałoby jeszcze odsiać tytuły i przyklejone afiliacje. Kolejne kolumny w dokumencie to:
habilitant przewodniczacy sekretarz recenzent1 recenzent2 recenzent3 czlonek1 czlonek2
Parsowanie było robione programem w C#, więc źródła programu nie będą pewnie zbyt użyteczne.
s000.tinyupload.com/index.php?file_id=72147233693972560332
Zgred,
Z pewnym marginesem błędu, bo oni tam mają straszny b...; np. pliki osoby NN w katalogu osoby MM.
@cutbold
Hosting na duże rzeczy z szyfrowaniem: mega.nz jedyna wada, że interfejs webowy we flashu i nie działa za dobrze w safari (reszta przeglądarek działa).
@trzy.14
Dzięki za OCR, będzie łatwiej
@cutbold
Szybki jesteś to mi się robota zmniejszyła :)
cutbold,
Aleś się szybko uwinął.
Ale w technicznych kluczowa wydaje się jeszcze kwestia dyscypliny, bo oczywiście nie ma grup trzymających jednocześnie architekturę i elektronikę, ale poszczególne dyscypliny - czemu nie?
A jeśli robisz OCR w tesseract (ja też), to on jest b. wrażliwy na plik wejściowy. Moje eksperymenty wskazują, że dobrze spisuje się png w odcieniach szarości (8 bit) i rozdzielczości 600 dpi. To, że kiedyś miałem słabe wyniki w OCR, wynikało najprawdopodobniej z niewłaściwej obróbki pliku wejściowego (tesseract nie potrafi obsłużyć pdf-ów), czego nie byłem świadom.
@trzy.14
Twój format pliku (jeden plik ze wszystkim postępowaniami, osoby oddzielone ====) jest wygodniejszy w przetwarzaniu niż mój (dużo pojedynczych plików). Graficzne pliki, które wrzuciłem na serwer to po prostu rysunki, które były w pdf. Znalazłem bibliotekę, która wyciąga części składowe pdf-a (tekst, rysunki) i napisałem program, który ściąga pdf-y, wyciąga pliki graficzne i zapisuje na dysku. W jakieś 15 minut jestem wstanie ściągnąć jedna dziedzinę. Jeśli coś jest jeszcze potrzebne, będę mógł to zrobić - wykorzystam do przekazania portal, o którym pisał @adam_beast.
Dyscyplinę ciężko sparsować, bo nazwy mogą być kilkuczłonowe, ale chyba nazwa dyscypliny znajduje się zawsze pomiędzy słowem "dyscyplinie" a kropką ".". Zobaczę, co się da zrobić.
Jest już dyscyplina - nazwy są niestety dość zaśmiecone. Fajnie byłoby, jakby jakaś dobra dusza przeglądnęła plik i poprawiła ewentualne literówki. To chyba dość trudno zrobić automatycznie.
s000.tinyupload.com/index.php?file_id=36348774028490428642
Tak mniej więcej wygląda graf postępowań habilitacyjnych w naukach technicznych:
s000.tinyupload.com/?file_id=00011791727987287739
Wierzchołki to osoby biorące udział w postępowaniach (zarówno komisja jak i habilitowani). Krawędzie łączą wszystkich uczestników postępowania (każdego członka komisji z pozostałymi i z habilitowanym). Graf jest nieskierowany.
Kolory oznaczają grupy (communities wykryte) algorytmem:
Vincent D Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre, Fast unfolding of communities in large networks, in Journal of Statistical Mechanics: Theory and Experiment 2008 (10), P1000
Im większy jest wierzchołek grafu, tym większy stopień wierzchołka (tym więcej połączonych jest z nim pozostałych wierzchołkach). Czyli: im większy wierzchołek tym w większej ilości postępowań występuje dana osoba.
Oczywiście dane są niepełne i zaszumione literówkami - ocenę, co wyszło zostawiam dyskutantom :-)
Wizualizacja zrobiona w gephi.org/
Plik źródłowy dla gephi (gdf):
s000.tinyupload.com/index.php?file_id=00296577809124527265
Polecam samodzielne wygenerowanie grafu!
inżynieria środowiska = prof. Janusz Jeżowiecki, co najmniej 45 postępowań, przewodniczący lub sekretarz
Graf cutbolda robi lepsze wrażenie niż moje liczby:
11 Andrzej Noworyta
11 Leopold Jeziorski
12 Janusz Kacprzyk
12 Tomasz Suchecki
14 Mieczysław Gostomczyk
15 Ryszard Tadeusiewicz
16 Józef Gawlik
16 Józef Korbicz
17 Jerzy Klamka
23 Janusz Mroczka
45 Janusz Jeżowiecki
Liczby to minimalne liczby postępowań hab., w których uczestniczyła dana osoba. Osoby z dołu tabeli są członkami CK - co za koincydencja. Liczby rzędu 10 nie wydają się rażące - chyba że w dyscyplinie odbyło się 20 postępowań, czego nie wiem.
(Z drugiej strony tworzenie się klastrów na wykresie jest naturale, bo nauki techniczne nie są homogeniczne).
Mam dziwne wrażenie, że te wykryte grupy się pokrywają z dyscyplinami. I tak np Automatykę trzymają Klamka, Tadeusiewicz, Korbicz, Kacprzyk (wszystko członkowie PAN)
@trzy.14
Być może powinno się dodać wagi do krawędzi, proporcjonalne do ilości postępowań w danej dyscyplinie (w tej chwili krawędzie nie są ważone). Pokazywało by to najważniejsze wierzchołki biorąc pod uwagę różne ilości postępowań w dyscyplinie. Ale to może w wersji 2.0 albo w kolejnych dziedzinach, o ile będzie na to zapotrzebowanie ;-)
@adam_beast
Jeżeli grupy pokrywają się z dyscyplinami, to znaczy, że model w miarę wiernie odwzorowuje rzeczywistość :-)
elektronika (30) = Mroczka (23) + Rogalski (6), obaj z CK; chyba tylko 4 postępowania z elektroniki są bez kogoś z CK w komisji.
@trzy.14
Tu jest wersja z wagami krawędzi, które są równe 1/ilość postępowań w dyscyplinie.
s000.tinyupload.com/index.php?file_id=27447175091706839805
Oczywiście dyscypliny też mają literówki, więc kumuluje to błędy OCR-a i parsowania. Ale teraz graf wydaje mi się nieco czytelniejszy.
@adam_beast,
Zajrzałem na prof. Klamkę (z szacunku dla naszego forumowego Klamczuchaosiedlowego, którego nick wywodzi się od klamki ;-) ), bo zdziwiło mnie, że memy tylu automatyków. Oto jego specjalizacje w komisjach habilitacyjnych (w których występuje wyłącznie jako przewodniczący):
- automatyka i robotyka +++++++
- informatyka ++++++++
- biocybernetyka i inżynieria biomedyczna +
- transport ++
Dziwne powinowactwo zainteresowań i zdolności z Ryszardem T., z wyjątkiem tego transportu, który w połączeniu z biocybernetyką wprawia w osłupienie ale tylko ze względu na oryginalność i innowacyjność tego połączenia: przecież swobodny przepływ między robotyką, biocybernetyką i informatyką od lat nikogo nie dziwi (bo "wszystkie Ryśki to fajne chłopaki")
I należy pamiętać, że mamy ostre niedoszacowanie, gdyż graf obejmuje WYŁĄCZNIE postępowania według nowej procedury. Więc nasz "diament polskiej automatyki" wychodzi tak skromnie.
Nie każdy może wie, ale te pdf-y cutbolda można swobodnie powiększać (zoom) bez utraty wierności obrazu. Polecam rolka, ctrl+rolka oraz shft-alt-rolka do wygodnej nawigacji sama myszką.
Tam widać galaktyki ale i samotne jakieś takie jakby planety lub układy podwójne. Skąd one? W biotechnologii jako dyscyplinie nauk technicznych odbyły się dotąd zaledwie 2 (DWA) postępowania habilitacyjne (+- OCR i CK). Innym czynnikiem mogą być przekłamania OCR.
Gephi jest świetnym programem, ponieważ generuje rysunki wektorowe. Co więcej, można też wyszukiwać interesujące nas osoby - w Acrobat Readerze Crl + F. Tu jest jeszcze wersja brzydsza, mniej "gazetowa", ale może jeszcze bardziej czytelna:
s000.tinyupload.com/index.php?file_id=54234768075707139949
Zgred,
I Rudek jest, i Wiliński...
Z Wilińskim wyszła ciekawa sprawa: ten sam załącznik 2 wstawiono do dokumentacji Jerzego Czekalskiego, Izabeli Czekaj i Pawła Czarnula.
STRASZNIE fajną robotę zrobiliście. Szczególnie zważenie tego liczbą postępowań w dyscyplinie daje lepszy wgląd.
Pytanie teraz, kto by wam to w kraju odważył się opublikować - szczególnie jeśli dołączyłyby pozostałe dziedziny. ;)
cutbold,
Możliwość przeglądania nazwiskami jest tak interesująca, że na noc zapuściłem nauki fizyczne i jutro będę prosił o małą przysługę :-)
@trzy.14
Nie ma sprawy - jak będzie CSV-ka podobna do tamtej mam już gotowy program.
Ciekawy jestem innych też dyscyplin, na przykład takich, o których często dyskutuje się na tym blogu. Ciekawość oczywiście czystko naukowa :-)
@nobbynooby
Myślę, że to już zostało opublikowane. Jeżeli ten blog ma 12-15 tysięcy wejść miesięcznie to jest dużo bardziej poczytny niż przeciętna publikacja naukowa. O CSV do pozostałych dziedzin trzeba prosić @trzy ;-)
Ja nie potrafię zrobić CVS; ja tylko OCR do pliku tekstowego...
@trzy.14
Tak, o to mi chodziło.
nobby,
Po pierwsze, w Polsce nie publikujemy niczego naukowego...
Po drugie, o ile cutblod najwyraźniej ma doświadczenie w analizie grafów i sieci powiązań, dla mnie to tylko pozanaukowa zabawa.
Po trzecie, coś z tym wypadałoby zrobić, tylko najpierw trzeba zwerbalizować "to coś". "Impact".
Po czwarte, interpretację surowych danych wypadałoby zlecić jakiemuś społ-humowi, tak na mojego nosa, najlepiej z doświadczeniem w badaniu system(u/ów) SzWiN.
Po piąte, podejrzewam, że jeśli ktoś decyzyjny miałby się zainteresować wnioskami, to tylko jako narzędziem do uzasadnienia swojej wizji "dobrej, marcowej zmiany" - niezależnie od opcji politycznej. Przecież naprawdę celnych uwag o kondycji polskiej nauki wygłaszano tak wiele, z tak nikłym przełożeniem na rzeczywistość, że aż się odechciewa.
Po szóste jednak, precz z defetyzmem! Publikacji naukowej nikt nie zauważy, ale publikację "zaangażowaną społecznie" w j. polskim - czemu nie? Tylko gdzie jest zwerbalizowany "Impact"?
I czy można mieć "Impact" po dniu zabawy?
Przecież gdyby to potraktować poważnie, wypadałoby przeanalizować wszystkie dyscypliny. Dołączyć docentkę, która prawdopodobnie mogłaby coś podobnego zrobić na słowackich serwerach, o ile są równie "świetnie" zabezpieczone jak nasze (np. juz nasze OPI broni się przed automatami, ale chyba umiałbym ich zabezpieczenia obejść, choć z drugiej strony to są informacje publiczne więc po co te zabezpieczenia obchodzić?). Może dałoby się uzyskać dane dla jakiegoś rozwiniętego kraju o podobnej do Polski wielkości. Dopiero wtedy można by się pokusić o werbalizację "Impactu". Tylko kto z nas ma tyle czasu?
@trzy.14
Masz rację, to całkowicie techniczna zabawa w której mam trochę wprawy. Zresztą bardzo dobrze płatna zabawa. Interesujące są wnioski ja takich nie podejmuję się tu wyciągać.
Dziedzina nauk humanistycznych:
s000.tinyupload.com/index.php?file_id=00448375650977902642
Ekonomia
s000.tinyupload.com/index.php?file_id=33589898902322730914
CSV dla ekonomicznych:
s000.tinyupload.com/index.php?file_id=07998685904593779276
CSV dla humanistycznych:
s000.tinyupload.com/index.php?file_id=05710234098514622425
CSV dla fizycznych:
s000.tinyupload.com/index.php?file_id=64499514945979522057
Graf dla fizycznych:
s000.tinyupload.com/index.php?file_id=94325241179039145888
Re: humanisci
Widac wyraznie, ze humanistyka rozpada sie na wyspy, ktore maja ze soba niewiele wspolnego i rzadko ze soba gadaja. Na dole od lewej dwie duze wyspy obok siebie to jezykoznawstwo i literaturoznawstwo. Duza wyspa na dole po prawej to historycy. Dwie male wyspy na gorze to archeologia i filozofia.
Pojedyncze archiwum z CSV, gdf oraz grafami dla ekonomii, fizyki, humanistyki, matematyki, medycyny, prawa, społecznych, technicznych. Skala, w której wyświetlone są wierzchołki różni się pomiędzy grafami i dobrana jest ze względu na ilość postępowań w dyscyplinie. Miłej zabawy!
s000.tinyupload.com/index.php?file_id=08480038919736264441
@cutbold
Super imponująca robota. A czym się różni nowy graf nauk technicznych od poprzedniego?
@adam_beast
Nie wiem o którym poprzednim mówisz - prawdopodobnie kolorami, może być obrócony względem "środka masy" i zamiast zakrzywionych krawędzi pewnie ma proste.
Cutbold:
CZAD; wielkie dzięki za Twoje zaangażowanie. Wszystkie te grafy są już ważone liczbą postepowań, prawda?
@nobbynooby
Tak, są ważone liczbą postępowań. Aby mieć wartości liczbowe, proszę zerknąć do plików dat. Tak jak dyskutowaliśmy, pomiary mogą być obarczone błędami OCR. Nie są to również pełne dane, ale na pewno co najmniej 50%-75% dla każdej dyscypliny
Niesamowicie ciekawe dane, przynajmniej te w pdfach (inne pliki mi sie nie chca otworzyc). Bedzie o czym dyskutowac.
@cutbold
Plik dat to plik tekstowy. Każda linijka to jedno postępowanie. Pierwsza linijka ma nazwy kolumn. Kolumny oddzielone są od siebie tabulatorami. Można je zaimportować np. do excala albo otworzyć w dowolnym edytorze tekstu (notatnik itp).
Pliki gdf to pliki z grafami do gephi - polecam zainstalować ten program i tam obejrzeć te grafy.
Chario. mnie zupelnie nie dziwi, ze humanistyka to wyspy, zarowno nauki humanistyczne, jak i spoleczne. Przeciez psychlogia, pedagogika, socjologia i obronnos nie maja nic wspolnego ze soba.
To, co mnei przeraza w tych grafach, to dominacja ilus tam osob. Realistycznie, mowimy w humanistyce o kilkunatu osobach, ktore maja wplyw na cale dyscypliny.
Co ciekawe tez postrzegany power danej osoby wcal enie musi sie laczyc z wplywem habilitacyjnym. dobrze to widac w psychologii.
@cutbold, bardzo dziekuje za info! super.
no i dziekuje za wykonana prace!
Swietna robota!
Wielkie dzieki :-)
Czy mozna poprosic o nauki chemiczne?
Z gory dziekuje.
@cutbold
Dzięki za komentarz.
Ze swojej strony, chciałbym obejrzeć nauki przyrodnicze i rolnicze ;)
No i z wnioskami trzeba byc ostrożnym.
W fizyce wybija się Marek Trippenbach, jednak
a) chciałbym mieć taki dorobek naukowy, jak on,
b) w zdecydowanej większości postępowań uczestniczył jako sekretarz, z wyboru własnej jednostki, która przeprowadzała przewód (i której jest prodziekanem ds badań naukowych).
Poza tym w fizyce nie widać GTW. Nie jest tak, jak w ekonomii, gdzie jedna osoba kontroluje połowę postępowań w całej dziedzinie, czy naukach technicznych, gdzie jedna osoba może kontrolować praktycznie całą dyscyplinę. W fizyce grona tworzą się raczej na zasadzie wspólnych zainteresowań.
Pi, jasne, ze trzeba byc ostroznym i na pewno mozna by wiele rzeczy niuansowac. Jednak roznica miedzy ekonomia i fizyka jest ogromna i ta roznica jest znaczaca i wiele mowi o statusie polskiej fizyki i ekonomii. Innymi slowy dane te to ciekawy kontekst dla tego, co 'po prostu widac'
Wiesz, gdyby sie okazalo w danych, ze naczelny pedagog kraju nie istnieje w pedagogice, to ja bym sie zastanawial. Jednak on istnieje, my wiemy, ze istnieje. Treaz tez wiemy, jak bardzo pedagogice jest potrzebny!
Do tych danych dodalbym jeszcze tylko jedna rzecz. Otoz, warto by bylo przelozyc 'impakt' na 'impakt finansowy'. przeciez ci ludzie zarabiaja potezna forse! Co zreszta juz kiedys omawialismy w odniesieniu do Ryszarda T., tytana pracy recenzyjnej.
To, co ja widze w humanistyce, tak intuicyjnie, bez sprawdzania:
a/ niektore dyscypliny sa zdominowane przez CK, inne mniej. Bierze sie to stad, ze np. w jezykoznawstwie czlonek CK przewodniczy zawsze, w literaturoznawstwie czesto prewodniczy kto inny.
b/ czlonkowie CK nie sa sobie rowni pod wzgledem sily oddzialywania - wybijajacych sie wizualnie nazwisk jest duzo mniej, niz liczy sekcja.
c/ po powiekszeniu wykresu widac wyraznie, kto ma dobre dojscia w CK, a kto nie ma ich wcale.
Wydziałów, w których prodziekan, ogłaszając proponowany skład komisji habilitacyjnej, kończy słowami, "sekretarzem jak zwykle będę ja" jest więcej. A za co mają kupić dzieciom mieszkania/samochody/inne?
Dala, widac, jak bardzo archeologowie sa odrebni od historykow i to jest niespodzianka. Z drugiej strony masz jednak duzo powiazan miedzy jezykoznawcami a literaturoznawcami i to tez troche dziwi w tym kontekscie. Archeologia z historia i jezykoznawstwo z literaturoznawstwem zazwyczaj sa na tych samych wydzialach.
Ford, po zapoznaniu sie z praktyka KH moge powiedziec, ze wladza sekretarza jest ogromna. To sekretarz decyduje, co znajdzie sie w protokole i o czym dowie sie RW.
Z tych danych można wyczytać też i inne sprawy, np. bardzo słabą obecność Wrocławia w postępowaniach z fizyki i astronomii (UWr + PWR + INTiBS łącznie brało udział w mniejszej liczbie postępowań niż UAM czy Toruń) czy też nadreprezentację Lublina (czy dlatego, że Lublin ma fizyka w CK?)
@kragon
biologiczne, chemiczne, ekonomiczne, fizyczne, humanistyczne, matematyczne, medyczne, prawne, rolnicze, społeczne, techniczne.
Jakby ktoś jeszcze chciał którąś z dziedzin proszę dawać znać.
s000.tinyupload.com/index.php?file_id=19050105654013917644
cutbold,
Wielkie dzieki :-)
Wyglada na to, ze nauki biologiczne i chemiczne (kazda z osobna\) wykazuja dosc dużą spojnosc.
Choc i tu (zwlaszcza w chemii) widac olbrzymia dominacje czlonkow CK.
Tak poza tym: rozumiem ze to jest jedynie na podstawie przewodow habilitacyjnych.
Wazne sa jednak tez (z uwagi na tzw "wpływ na rozwoj kadry" jak to nazywa diament RT) recenzje profesorskie (poki co w niewielkim stopniu nowego trybu ujawnione) oraz recenzje dla CK przy postepowaniach profesorskich - to chyba w tych ostatnich byłoby widac bardziej "wplyw na (niedo)rozwoj dyscypliny"
@trzy.14
w fizyce widac mala obecnosc Wrocłąwa, zwłaszcza bardzo dobrego ale i bardzo wymagajacego Redlicha - czyzby był zbyt wymagajacy? i dlatego rzadko powolywany?
@kragon
Te grafy można interpretować jako agregacje po osobach na zbiorze postępowań habilitacyjnych z ważonymi składnikami sum względem dziedzin. Nie mam wiedzy we wszystkich dyscyplinach, ale te, które znam stworzyły ładne klastry względem dziedzin.
Jeśli będą kolejne dane np. z wynikami postępowań, afiliacjami, dorobkami itp. będzie można pokusić się o bardziej złożoną analizę, może nawet o odkrycie jakiejś wiedzy ;-) Na razie na tyle krawiec kraje na ile mu materii staje.
@cutbold
> Jakby ktoś jeszcze chciał którąś z dziedzin proszę dawać znać
Prośba: czy mógłbyś zobrazować nauki medyczne?
Z pewnych przyczyn mocno mnie interesują.
@cutbold
Przepraszam za zamieszanie, ale dopiero teraz zauważyłem, że w ostatnio udostępnionym pliku zamieściłeś nauki medyczne. Jednak tam nie ma osób, które mnie interesują. Prawdopodobnie, z uwagi na rozproszenie interdyscyplinarne, wylądowały w naukach biologicznych, więc korygują moją prośbę: o nauki biologiczne.
Zgred, biologiczne juz sa chyba.
Dzięki @dala, wreszcie ich znalazłem: dziedzina nauk farmaceutycznych.
Ależ ich rzuciło w dziwne miejsce.
No to jeszcze raz uderzam z prośbą do @cutbolda: nauki farmaceutyczne.
Teraz posprawdzałem dwa razy, aby nie prosić o już udostępnione. Farmaceutycznych nie znalazłem.
Proszę bardzo. W bonusie przesyłam WSZYSTKIE 22 dyscypliny w jednym archiwum (tak Zgredzie - udało się nawet przed końcem tygodnia ;-) ). Jeśli kogoś nie ma, mógł się nie sparsować (na przykład pdf w załączniku numer 2 miał więcej niż jedną stronę, nawalił OCR, plik graficzny w pdf-ie nie był ani jpg ani tiff) - te wszystkie techniczne problemy mogły ewentualnie wystąpić.
s000.tinyupload.com/index.php?file_id=00005459829724186257
Mam nadzieję, że dane i ich wizualizuje będą pomocne w analizie choć części tego, co znajduje się obecnie na stronach CK :-)
cutbold,
A czy jakoś poradziłeś sobie z tym, że kilka procent plików "zal2.pdf" ma kilka stron i tylko pierwsza z nich ma użyteczną treść?
cutbold,
w fizycznych masz 109 rekordów, a w rzeczywistości ich jest ok. 200. W szczególności nie masz nikogo po literze T.
@trzy.14
Tak jak pisałem w poprzednim poście - zignorowałem. Tych postępowań nie biorę pod uwagę. Jak dostanę grant z NCBiR na digitalizację zasobów CK to będę rozpatrywał takie niuanse :-)
@trzy.14
Jest na przykład Mieczysław Zielczyński. Tak jak pisałem - jest pomiędzy 50% a 75% danych. Teraz należałoby zatrudnić moderatorów, którzy będą poprawiali literówki w OCR-ach. Ja na to budżetu niestety nie mam :-)
Leśnicy trzymają się mocno!
Po co aż dwóch leśników w CK, skoro jak dotąd (w nowej procedurze) obsłużyli raptem z 20 postępowań?
@cutbold
> W bonusie przesyłam WSZYSTKIE 22 dyscypliny w jednym archiwum
Wielkie dzięki.
> (tak Zgredzie - udało się nawet przed końcem tygodnia ;-) ).
Wyobrażam sobie jutrzejszy stres wśród członków CK, szczególnie tych dominujących, gdy dotrze do nich wieść o tej digitalizacji i obrazowaniu. A dotrze na pewno, gdyż wieści od wczoraj daaaleko poszły w świat, a dziś docierały już do mnie jakby z drugiej strony globu.
> Jak dostanę grant z NCBiR na digitalizację zasobów CK to będę
> rozpatrywał takie niuanse
No to wskazówka, ile żądać: instytut Wałęsy dostał na digitalizację swoich zasobów ponad 0,5 mln zł. To nie była finezja, gdyż to nie Muzeum Narodowe, a ponadto sporo rzeczy wytworzonych po roku 1990 i tak jest już w formie cyfrowej. Robota jednak nie została wykonana. Ba! Ona nawet nie została zaczęta. Ostatnio ujawniono, że termin wykonania został prolongowany o dwa lata, na koniec 2017.
Cutbold,
Czyli problem jest w automatycznym parsowaniu treści plików tekstowych?
@staryzgred2012
Dzięki za info - za mniej raczej się tego nie opłaca tego robić.
Pewnie takie pytanie padnie, więc je uprzedzam:
1. Klastry oznaczone kolorami zostały wykryte algorytmem:
Vincent D Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre, Fast unfolding of communities in large networks, in Journal of Statistical Mechanics:
Theory and Experiment 2008 (10), P10008, DOI: 10.1088/1742-5468/2008/10/P10008
zaimplementowanym według:
R. Lambiotte, J.-C. Delvenne, M. Barahona, Laplacian Dynamics and Multiscale Modular Structure in Networks, IEEE Transactions on Network Science and Engineering (Volume:1 , Issue: 2 ) pp. 76-90, 2015, DOI: 10.1109/TNSE.2015.2391998
2. Układ grafu został wygenerowany algorytmem:
Mathieu Jacomy , Tommaso Venturini, Sebastien Heymann, Mathieu Bastian, ForceAtlas2, a Continuous Graph Layout Algorithm for Handy Network Visualization Designed for the Gephi Software, PLoS One. 2014 Jun 10;9(6):e98679. doi: 10.1371/journal.pone.0098679. eCollection 2014
Ciekawy jestem swoją drogą - i tu pytanie do osób znających poszczególne dziedziny - na ile ten model wiernie odwzorowuje rzeczywistość? Ciekawe są szczególnie te dyscypliny, gdzie graf nie został podzielony na w miarę luźno połączone podgrafy jak to ma miejsce na przykład w naukach społecznych o czym pisał wcześniej dala.tata.
@trzy.14
Problemy, które mogły wystąpić (tak na gorąco, bo nie bardzo mam czas już nad tym aktywnie siedzieć):
- błędny OCR - popatrz na przykład na imię Andrzej - prawie zawsze jest rozpoznane jako "Anzej" (!). No ale OCR jest darmowy...
- zakładałem z tego co pamiętam, że miejsce, w którym podani są członkowie komisji ma rozdzielone funkcje w postępowaniu od danych osobowych płazą "-". Okazało się to w dużej części przypadków prawidłowym przypuszczeniem.
- Odnajdowanie pozycji, w którym jest linijka dotyczące komisji rozpoznawana jest fragmentem słów np. "przewod" - przewodniczący. Na tym OCR nie da się raczej brać pod uwagę dłuższych napisów bo wyraz "przewodniczący" ma "ą" i jest dość długi i często w nim jest błąd.
Takich niuansów jest mnóstwo - pewnie części nawet nie jestem świadomy.
--------------------
Proszę pamiętać:
Dane i wykresy mają charakterter poznawczy, mogą być obciążone różnorodnymi błędami zawinionymi na przykład przez software z którego kożystałem. Z tego powodu nie biorę za nie żadnej odpowiedzialności. Nie należy ich traktować jako pełne oraz pewne źródło informacji przy podejmowaniu decyzji, stawieniu diagnoz, wygłaszaniu opinii itd.
Dane mają charakter otwarty i zostały sporządzone na podstawie powszechnie dostępnych danych na serwerze www.ck.gov.pl/
Ta ostatnia informacji tak na wszelki wypadek - skoro tyle osób się nimi interesuje...
Z pozdrowieniami dla Zgreda, czołówka nauk farmaceutycznych:
7 Stanisław Ryng
8 Franciszek Sączewski
9 Jan Krzek
9 Stanisław Boryczka
10 Elżbieta Mikiciuk
10 Jerzy Pałka
12 Maciej Pawłowski
13 Zenon Kokot
16 Piotr Szefer
25 Jan Pachecka
Dokładność szacuję na ponad 95%.
(w szczególności skanuję zalącznik 2 jeśli ma on 1-3 strony oraz załącznik1 jeśli załacznik 2 ma co najmniej 4 strony, co oznacza recenzję)
cutbold,
wow, jesteśmy (tu) dzięki tobie na cutting-edge! Algorytmy z pism za 35-40 kudryków! I świeżutkie jak ciepłe bułeczki!