Robię habilitację

Wpis

czwartek, 31 marca 2016

Gruby Rycho

Zaniedbałem się ostatnio w śledzeniu nowych postępowań, więc rzuciłem się na poszukowanie nowych wpisów w naukach humanistycznych. I rzeczywiście, co chwila znajdowałem monografię z Łodzi, Gdańska, Bydgoszczy (nie mówiąc o miastach, ktore nie są stolicami województw), a wszystkie ze znacznym wpływem na rozwój wielu dyscyplin. Historia, literaturoznawstwo, językoznawstwo, wszystkie rozwinęły się znacznie po opubliowaniu tych wiekopomnych zapewne dzieł. Jednak po raz kolejny zwróciło moją szczególną uwagę to, że habilitanci co rusz podają w autoreferatach recenzentów wydawniczych książek. I po raz koleny mnie ta praktyka zastanowiła.

 

Zastanowiło mnie to, że habilitanci podają te nazwiska. Przecież recenzent wydawniczy (co już dawno temu zauważał podworkowy) ocenia książkę inaczej niż recenzent habilitacyjny. To, że książkę warto wydać, wcale nie musi oznaczać, że powinna być podstawą nadania stopnia. Moe być przecież książka dobrym przeglądem badań, może być ciekawie napisana, możemy liczyć na to, że dobrze się sprzeda. Te wszystkie cechy nie mają jednak większego znaczenia w ocenie książki przecz recenzenta habilitacyjnego. Nazwiska recenzentów wydawniczych mają więc pewnie funkcję rzucenia ważnym nazwiskiem w nadziei, że mniej ważny recenzent habilitacyjny nie będzie się chciał przeciwstawić.Tak jak się mówi, że się zna Rycha, Zbycha, małego Czarka i grubego Benka. Ot, polska habilitacja.

 

Zastanawiałem się też nad tym, że wydaje się być powszechne to, że autorzy znają swych recenzentów. Potem jednak uświadomiłem sobie, że niejednokrotnie widziałem nazwiska recenzentów wydrukowane w książkach. Trochę mnie ten zwyczaj dziwi. Po to właśnie recenzenci są anonimowi, by nie musieli martwić się o wszelkie układy i układziki, które, chcąc nie chcąc, muszą wpływać na to, jaka jest ostateczna forma recenzji. Ot, polska humanistyka.

 

Szczegóły wpisu

Tagi:
Autor(ka):
habilitant2012
Czas publikacji:
czwartek, 31 marca 2016 00:27

Polecane wpisy

Komentarze

Dodaj komentarz

  • trzy.14 napisał(a) komentarz datowany na 2016/03/31 01:14:20:

    Zdziwiłbym się, gdyby recenzentów wydawniczych wybierał ktokolwiek inny niż habilitant/profesorant. Mogę sobie nawet wyobrazić, że w wielu przypadkach to on ich opłaca. Wyjątek gotów jestem zrobić dla renomowanych wydawnictw, ale tylko wtedy, gdy na wydanie monografii dostaną dotację. W końcu biznes to biznes!

    Autentyczna rada wydawcy mającego kontakt ze środowiskiem naukowym: "Pan dostarcza manuskrypt i 2 recenzentów, ja daję ISBN i książka habilitacyjna gotowa!".

  • adam_beast napisał(a) komentarz datowany na 2016/03/31 05:50:04:

    Jeden recenzent wystarczy. I tak recenzje wydawnicze sa na sztukę tylko po to by punkty za książkę były.

  • klamczuchosiedlowy napisał(a) komentarz datowany na 2016/03/31 11:06:48:

    może i tak jest czasami
    W niektórych krajach aby książka liczyła się jako monografia - nazwiska 2 recenzentów muszą być wymienione na początku.
    U nas i w komercyjnych wydawnictwach w ktorych ksiazki wydawalem (bez dotacji) zawsze wydawca oplacal recenzentow i na wybor recenzentow nie mialem wplywu. W uczelnianym wydawnictwie wręcz wybrano ich pod kątem tego aby byli mi obcy i aby byli znani z tego, że między nimi a moim szefem jest raczej chłodno - bez mięty. Uzasdniając, że jak oni to puszczą, to już nikt po nich nie będzie się niczego dopatrywał. Może o to chodzi z tym ujawnianiem? Recenzenci wiedzą, że to ma być książka profesorska lub habilitacyjne osiągnięcie i tak recenzują.

  • dala.tata napisał(a) komentarz datowany na 2016/03/31 11:20:54:

    Drobna uwaga, kilkukrotnie bylem proszony przez dobre miedzynarodowe wydawnictwa o to, by sugerowac recenzentow. Czy wydawnictwa korzystaly z tych sugestii, nie mam pojecia, recenzje byly anonimowe. Wielokrotnie tez pisalem recenzje wydawnicze,, zawsze rowniez anonimowo.

    Oczywiscie, gdy pisze sie recenzje dobrej ksiazki, latwo jest ja pisac i to pod swoim nazwiskiem. Gdy sie pisze negatywna recenzje (calej ksiazki, a nie propozycj), to jest to trudne, a trudniejsze z podpisem. Nie chodzi o to, ze ja nie chce si epodpisac pod tym, co pisze. Jednak zdarzylo mi sie pisac recenzje negatywna ksiazki napisanej przez osobe, ktora znalem osobiscie (moze, nie dobrze, ale jednak spotykalismy sie na konferencjach i rozmawialismy ze soba). Pomimo tego, ze recenzje nie sa personalne, to i tak negatywna recenzja musi miec wplyw na relacje miedzy ludzmi. i dlatego lepiej, jak jest anonimowa.

    Co do wpsiu - podawanie nazwisk recenzentow wydawniczych jest rzeczywiscie mwoieniem: za mna juz stoi prof Iksinski. I dlatego jest dosc zenujace.

  • klamczuchosiedlowy napisał(a) komentarz datowany na 2016/03/31 11:55:34:

    znajomy w nowym trybie dostal obu wydawniczych recenzentow jako czlonkow recenzentów komisji habilitacyjnej - wlasnie dlatego, ze ujawnil ich w autoreferacie i we wniosku

  • trzy.14 napisał(a) komentarz datowany na 2016/03/31 12:11:35:

    Ale my tu nie dyskutujemy o "dobrych międzynarodowych wydawnictwach" tylko o podwórku lokalnym nawet w skali Polski; co chwila znajdowałem monografię z Łodzi, Gdańska, Bydgoszczy (nie mówiąc o miastach, ktore nie są stolicami województw), a wszystkie ze znacznym wpływem na rozwój wielu dyscyplin.

    Weźmy kogoś, kto merytoryczną część autoreferatu (prawo) zaczyna od następującej tezy:
    W wyniku przeprowadzonych badań ustaliłem, iż źródeł idei władzy ludu można doszukiwać się w rozwiązaniach ustrojowych starożytnej Grecji i Rzymu
    Jeśli takie odkrycia są w autoreferacie, to cóż dopiero musiało się znaleźć w monografii! I przeszło, a habilitant zajął pozycję decyzyjną i to nie w administracji nauką, tylko w samej nauce.

  • adam_beast napisał(a) komentarz datowany na 2016/03/31 15:14:50:

    @trzy.14
    Po tym co napisałeś wynika, że fakt że autoreferaty na stronie CK są udostępniane w wersjach nieprzeszukiwalnych jest po prostu zbrodnią.
    No ale wtedy Nauka Polska mogłaby zostać ośmieszona przez byle dziennikarzynę z googlem, a tak musi ktoś te autoreferaty czytać.

  • dala.tata napisał(a) komentarz datowany na 2016/03/31 16:22:13:

    Pi, jasna sprawa. I takich ksiazek, ktore ustalaja po przeprowadzeniu doglebnych badan, ze ksiazki sluza do czytania, jest bardzo, bardzo wiele.

    ale, dla porzadku, rowniez w polskich książkach znajduja sie rzeczywiscie dobre badania. niedawno zreszta pisalem recenzje doskonalej ksiazki po polsku. Najwyrazniej zreszta wydanej po polsku, zeby sie recenzenci habilitacyjni odpieprzyli.

  • jwf napisał(a) komentarz datowany na 2016/03/31 16:37:10:

    Zamiast naśmiewać się z zamieszczania nazwisk recenzentów wydawniczych w autoreferacie, lepiej może najpierw sprawdzić, jak wygląda wzór autoreferatu zamieszczony na stronie ck
    www.ck.gov.pl/images/PDF/komunikaty/wzor_autoreferat.pdf
    punkt 4b.

  • habilitant2012 napisał(a) komentarz datowany na 2016/03/31 17:09:48:

    @jwf Przepraszam, nie widziałem tego. Nie potrafię tego sensownie skomentować.

  • trzy.14 napisał(a) komentarz datowany na 2016/03/31 17:53:59:

    Załącznik do Zarządzenie nr 33 Rektora Politechniki Białostockiej z dnia 13 marca 2009 roku.

    §3
    5. W pierwszej kolejności powinny być wydawane publikacje mające bezpośredni wpływ na awans naukowy pracowników Politechniki Białostockiej, a w szczególności rozprawy habilitacyjne.

    §8
    3. W opinii wydawniczej monografii recenzent powinien określić wkład autora do rozwoju danej dyscypliny naukowej. W opinii rozprawy habilitacyjnej powinno się także znaleźć jednoznaczne stwierdzenie, że recenzowana praca spełnia wymogi rozprawy habilitacyjnej.


    Czy ktoś, kto recenzował monografie habilitacyjne, mógłby rozjaśnić, jaka jest rola recenzenta wydawniczego monografii habilitacyjnej wydawanej w uczelnianym wydawnictwie?
    a) quasi-recenzent habilitacyjny
    b) osoba zaświadczająca, że dana książka to nie jest humbug, czyli ktoś, kto dba o interes finansowy wydawnictwa/uczelni.

    Żądanie CK wskazuje, że poprawną odpowiedzią jest a)
    Zarządzenie Rektora bliższe jest odpowiedzi b)

    Z tym, że punkt b) prościej byłoby załatwić pismem od dziekana, natomiast punkt a) to jawne bezprawie i gotowy przepis na mobbing w białych rękawiczkach. Ponawiam więc pytanie: jaka jest rola recenzenta wydawniczego monografii habilitacyjnej wydawanej w uczelnianym wydawnictwie?

  • dala.tata napisał(a) komentarz datowany na 2016/03/31 18:55:58:

    Pi, musze powiedziec, ze ja sie tez nad tym zastanawialem. I wbrew temu, co zarzadil rektor, nie jestem pewien, czy o to chodzi.

    Sprawa finansow jest poza kwestia - przecie te ksiazki czesto wydawane sa z jakichs grantow itd. Wydawnictwo nie ponosi zadnego ryzyka finansowego. Umowmy sie tez - trudno mowic o jakims ryzyku reputacyjnym. Ile ksiazek uniwersyteu w bydgoszczy czytales ( nie mowiac juz o Kutnie czy Siedlcach)? I czy humbug wydaniczy zmieni twoje praktyki czytelnicze?

    No chyba ze chodzi o jakies tresci niezgodne z prawem, szkalujace kogos...ale wtedy to powinien czytac prawnik?

    Nawiasem mowiac, ladnych pare lat temu widzialem ksiazke wydana przez wydawnictwo w Siedlcach. Oni nawet spell-checku nie zrobili! Ta ksiazka byla straszna! Blad za bledem. Mialo sie wrazenie, ze oni wydrukowali wprost to, co dostali od autora, a autor zapomnial zrobic spellchecku ostatniej wersji. I co? myslisz, ze Siedlce UP press sie rozpadlo przez to?

  • dala.tata napisał(a) komentarz datowany na 2016/03/31 18:57:40:

    I pozostaje konkluzja, ze rola recenzenta wydawniczego jest pokazanie, ze jego/jej wlocznia stoi po dstronie habilitanta :)

  • gruby.paker napisał(a) komentarz datowany na 2016/03/31 19:44:44:

    Nikt nie wziął pod uwagę tego, że wybór recenzenta wydawniczego może być też podyktowany chęcią wyeliminowania go z grona recenzentów habilitacyjnych, a jego krytyczne uwagi podnieść wartość rozprawy

  • charioteer1 napisał(a) komentarz datowany na 2016/03/31 21:00:49:

    Paker podal bardzo wazny powod wyboru recenzenta wydawniczego. Cala seria monografii habilitacyjnych w zaprzaznionym osrodku byla recenzowana przez pewna pania profesor, o ktorej mowiono, ze "czepia sie". Faktycznie czepia sie bez sensu zupelnie, wiec lepiej bylo jej unikac jako recenzenta habilitacyjnego. Ale to wszystko zalezy od lokalnych ukladow. Znam tez calkiem liczne przypadki powolywania recenzenta wydawniczego jako habilitacyjnego.

  • trzy.14 napisał(a) komentarz datowany na 2016/03/31 21:13:06:

    Czyli recenzent wydawniczy nie jest wybierany przez wydawnictwo?

  • czlowiek.z.makulatury napisał(a) komentarz datowany na 2016/03/31 21:25:48:

    Nie. Zazwyczaj do garażu przychodzi się drukować z własnym recenzentem.

  • trzy.14 napisał(a) komentarz datowany na 2016/03/31 22:01:03:

    Ale chyba nie trzeba ciągać biednego recenzenta po garażach - nie wystarczy jego nazwisko na stronie redakcyjnej?

  • adam_beast napisał(a) komentarz datowany na 2016/04/01 08:22:00:

    Tymczasem na AGH...
    List jednego profesora do uczelnianego kolegium elektorów

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/01 12:14:34:

    @adam_beast

    Oj tam, oj tam. Zwykły gry i zabawy ludu polskiego przed kolejnymi wyborami mistera najbardziej odjechanych obietnic.

    Rzućmy natomiast okiem retrospektywnie (link) przypominając sobie co ciekawsze uwagi sprzed pięciu lat:

    ...o, że za pięć lat polskie uczelnie, albo przynajmniej choć jedna z nich, trafią do pierwszej setki światowych rankingów, wydaje mi się po pierwsze niemożliwe, a po drugie niepotrzebne.
    Celem uczelni wyższych w Polsce powinno być teraz kształcenie ludzi, którzy mają kształcić kolejnych. (...) Największym skandalem i wstydem polskiego szkolnictwa wyższego jest bowiem fakt, że po 20 latach, w ciągu których przybyło 1,5 mln studentów, liczba nauczycieli akademickich pozostała niezmieniona i wynosi 60 tys...


    Coś się zmieniło? Nic. Obecne wybory rektorów też nic nie zmienią, bo ten system jest zagłodzony finansowo do granic egzystencji.
    I nie zgodzę się tu z niektórymi reformistycznymi progresistami, że najpierw reformy, a dopiero potem kasa. Bo potem już nic nie będzie. Ani nikogo. Tak jak u tego żałosnego Kononowicza...

  • czlowiek.z.makulatury napisał(a) komentarz datowany na 2016/04/01 14:55:53:

    @pi - rzecz jasna nie chodziło mi o schodzeniu do garażu fizycznie z recenzentem, ale z wyznaczonym recenzentem. Normą jest też w wielu wydawnictwach, że przyjmuje się manuskrypt od razu z recenzjami. Szast prast, faktura i drukarki ładują egzemplarze autorskie oraz wydania dla BN i przyszłej komisji habilitacyjnej.

  • tulloch napisał(a) komentarz datowany na 2016/04/01 15:25:00:

    @staryzgred2012

    Zgoda, kasy jest za mało. Ale, po pierwsze - na co nam 1,5 mln studentów, 60 tys. doktorantów itd., po drugie - nie sądzisz, że ten system potrafi wchłonąć dowolną ilość kasy, jako wynik dając to samo co teraz?

  • trzy.14 napisał(a) komentarz datowany na 2016/04/01 16:48:06:

    W przytoczonym przez adam_beast'a dokumencie wymienia się z nazwiska 4 osoby, pełniące funkcje:
    - obecnego rektora AGH
    - byłego rektora AGH
    - członka rzeczywistego PAN
    - trzech członków CK, w tym przewodniczącego CK i wielokadencyjnej diamentowo-szarej eminencji CK
    - funkcji dziekańskich aż trudno zliczyć
    - przewodniczącego rady nadzorczej Tauronu
    - fundatora rzeźby swojej żony na kampusie AGH

    Jeden z bohaterów, któremu nie dane było (dotąd) zostać rektorem, członkiem czy przewodniczącym, na swojej stronie napisał:

    W ostatnich 15 latach kierowałem 13 grantami badawczymi finansowanymi w ramach Konkursów KBN, MNiSzW oraz NCBiR i NCN. Jestem członkiem grupy ekspertów NCBiR i NCN.

    Więc o ile zgadzam się, że pieniędzy jest ogólnie za mało, to w tym konkretnym przypadku problem leży chyba gdzie indziej: ich jest za dużo! I to wokół tych pieniędzy utworzyła się "GTW na AGH".

    Prawdopodobnie więc główny problem leży nie w ilości pieniędzy, tylko w tym, jak one przepływają. O ile my tu lubimy wyżywać się na społ-humach, to to, co dzieje się wśród technicznych prawdopodobnie jest jeszcze gorsze - bo społ-humy na naprawdę innowacyjne wałki są po prostu za biedne.

    ***

    Wg OPI, autor apelu wykonał dotąd okrągłe zero recenzji doktorskich i habilitacyjnych.

    ***

    Gdyby więc , jak pisze adam, autoreferaty (szerzej: dokumentację awansową) umieścić w wersji przeszukiwalnej, można by dość szybko dojść do tego, czy (a raczej: gdzie) istnieją Grupy Trzymające Recenzje. Jeśli się tego nie robi, oznacza to, że te grupy trzymają też CK.

  • cutbold napisał(a) komentarz datowany na 2016/04/01 17:20:26:

    @trzy
    Jeśli baza zostałaby udostępniona w wersji przeszukiwalnej osoba potrafiąca jedynie pisać skrypty przetwarzające tekst w kilka minut mogłaby zdobyć wiedzę o zależnościach w nauce polskiej które samodzielnie poznaje się latami. Ze wszystkich dziedzin. I jeszcze je ładnie zwizualizować.

  • nobbynooby napisał(a) komentarz datowany na 2016/04/01 18:13:34:

    @Pi,
    A jak tam z cytowalnością i "dorobkiem" na podstawie tych grantów? (ja rozumiem, że to NIE ON pisał, że miał murzynów, ale ciekawi mnie, co z tych 15 grantów wynikło dla nałki).

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/01 18:29:15:

    @trzy.14
    > Gdyby więc , jak pisze adam, autoreferaty (szerzej: dokumentację
    > awansową) umieścić w wersji przeszukiwalnej


    Hm, ile jest łącznie takich postępowań do przejrzenia? W końcu wystarczy zassać serwer CK, podzielić się robotą, a potem wygenerować bazę przeszukiwalną.

    Taaaaki Paryż chyba jest wart mszy?

  • trzy.14 napisał(a) komentarz datowany na 2016/04/01 18:54:08:

    nobbynooby,
    21 dokumentów i 25 cytowań w Scopus (całość dorobku, z wykluczeniem samocytowań współautorów).

    Wykazałem się czujnością rewolucyjną i kliknąłem w te 25 artykułów, po czym wykluczyłem te, które mają polskie afiliacje. Zostało 10. Wszystkie z lat 2013-2015, co świadczy o systematycznym rozwoju naukowym analizowanej osoby. W sumie mogłaby objąć już jakieś przewodniczenie albo choćby członkostwo.

    Zafrapowany tym odkryciem, jak przystało na pracownika nauki (jak to brzmi!), postawiłem hipotezę badawczą: reformy Kudryckiej wpłynęły na sposób publikowania nawet na AGH i stąd pojawienie się zewnętrznych cytowań w 2013.

    Faktycznie, z indeksowanych 21 artykułów, aż 15 opublikowano w latach 2012-2015 (4 rocznie). Pozostałe 6 zostało opublikowanych w latach 2002-2011 (2/3 rocznie).

    Uzyskany tytuł profesora: 1996

    Mamy 3 kolejne hipotezy badawcze, na które nie znam odpowiedzi:
    a) w roku 2012 lub 2011 nastąpił skokowy przyrostu umiejętności badawczych szefa
    b) w roku 2011 lub 2012 nastąpił skokowy przyrost zdolności publikacyjnej szefa (np. poprzez dołączenie do kolegium redakcyjnego pisma z LF)
    c) w roku 2012 lub 2011 w zespole szefa pojawił się jakiś młody Rudek

  • trzy.14 napisał(a) komentarz datowany na 2016/04/01 19:06:51:

    zgred, nie mam oprogramowanie do OCR-owania tych PDF-ów. Szczerze, to kiedyś próbowałem (!), ale z tego, co mam (niekomercyjne), wychodziła sieczka. Gdyby pdf-y były generowane z tekstu (np. przez word), średnio zdolny magistrant a może i licencjusz dałby radę.

    Jednak google potrafi wgryźć się w te pdf-y (wydaje mi się, że potrafi indeksować zawartość przynajmniej części z nich), więc to tylko kwestia jakości posiadanego OCR-a...

    Na pewno można zassać i przeanalizować dane z OPI, ale potrzeba jakiegoś rozgarniętego magistranta, żeby z tym potem coś zrobił. OPi ma jednak wiele wad (niepełność bazy, brak informacji o negatywnych postępowaniach, niezwykła szczupłość informacji o postępowaniach profesorskich, które wydają się kluczem).

    Natomiast kilka osób razy kilka godzin pracy powinno być w stanie udowodnić "hipotezę naukową": w każdym postępowaniu z ekonomii uczestniczy członek CK.

  • kragon napisał(a) komentarz datowany na 2016/04/01 19:48:08:

    @pi

    hipotezę "w każdym postępowaniu z ekonomii uczestniczy członek CK" mozna oczywiscie wryfikowac doswiadczalnie, ale to tylko w odniesieniu do "uczestniczył".
    Mozna wszakze ja po prostu udowodnic:
    - do CK wybiera sie ekonomistow najlepszych
    - najlepsi ekonomisci licza najlepiej wlasne dochody
    - uczestniczenie w postepowaniach jest platne

  • cutbold napisał(a) komentarz datowany na 2016/04/01 19:50:00:

    Nie wiem, czy to trzeba OCR-ować. Jeśli chce się po prostu zbadać składy komisji i konkluzje recenzji to zrobienie tego automatycznie może być problematyczne, jeżeli dokumenty mają różne szablony. Moim zdaniem najwygodniejszy do przetwarzania byłby CSV z podstawowymi danymi:

    Imię i nazwisko kandydata,
    Jednostka w której pracuje kandydat,
    Jednostka, w której odbywa się postępowanie,
    Imię i nazwisko przewodniczącego,
    Imię i nazwisko recenzenta 1,
    Imię i nazwisko recenzenta 2,
    Imię i nazwisko recenzenta 3,
    Imię i nazwisko członka komisji 1,
    Imię i nazwisko członka komisji 2,
    Imię i nazwisko członka komisji 3,
    Czy konkluzja recenzji 1 była pozytywna
    Czy konkluzja recenzji 2 była pozytywna
    Czy konkluzja recenzji 3 była pozytywna
    Czy nadano habilitację
    Działa, pod warunkiem, że imiona i nazwiska są unikalne.
    Do udowodniania hipotezy o której pisał @trzy trzeba zrobić słownikową CSV-kę z danymi recenzentów
    Imię nawisko,
    Afiliacja,
    Członek CK,
    inne ważne członkostwa...
    Czy coś pominąłem?

  • nobbynooby napisał(a) komentarz datowany na 2016/04/01 20:35:42:

    @Pi
    Hipotezę #3 łatwo sprawdzić, testując pozostałych współautorów na wcześniejsze z tą osobą publikacje. Wiem na własnej skórze, że [a="pokazywarka.pl/n6oxvv/]jedna osoba robi różnicę[/a] (dołączyłem do zespołu mojej szefowej w końcu 2010r.).

    Bardzo dziękuję za dane!

  • trzy.14 napisał(a) komentarz datowany na 2016/04/01 20:50:47:

    nobby, nie masz dostępu do Scopusa? Jakim cudem?

  • nobbynooby napisał(a) komentarz datowany na 2016/04/01 21:01:07:

    @Pi,
    Piszę z domu; na domowym nie mam zapamiętanego hasła.

  • adam_beast napisał(a) komentarz datowany na 2016/04/01 21:14:41:

    @cutbold
    To może poprostu postawić anonimowy dokument na google docsach i zaczac to robic.
    Problem jest z nowymi danymi - CK w żaden sposób nie porządkuje danych, które przybyły. Z tego powodu jak się raz zassa zawartość to potem ciężko ogarnąć jakie postęowania się później pojawiły.

  • trzy.14 napisał(a) komentarz datowany na 2016/04/01 21:16:29:

    nobby,
    Przecież ja też piszę z domu... Do Scopusa mam dostęp poprzez VPN zorganizowany przez bibliotekę główną mojej uczelni; alternatywą jest wydziałowy VPN. Dzięki temu można pracować w domu jakby siedziało się na uczelni.

    Zgred,
    ten cytat z "Polityki" bardzo dobry, tylko że autorka w jednym miejscu przestrzeliła: celem edukacji wyższej nie jest kształcenie nauczycieli! Wolę wczorajszego Guardiana

    Only students who dont need jobs can afford an education that does not prepare them for the workplace, and very few are in this position. Getting a good job is consistently given in student surveys as the main motivation for going to university, and students expect a professional degree to prepare them for their chosen profession. This is as true in law, engineering, architecture and medicine as it is in nursing, education or management.
    ...
    For example, at the University of Waterloo in Canada, all 14 of their undergraduate engineering programmes involve up to two years working in industry.


    Cholera, jak ja mam studentów przygotować do pracy zawodowej, skoro nigdy nie pracowałem poza sektorem akademickim?

  • nobbynooby napisał(a) komentarz datowany na 2016/04/01 21:21:29:

    @Pi,
    Informatyków pytałem o VPN już w 2011r. (uniwerek w USA, z którego właśnie wracałęm, zapewniał VPN na defaulcie). Usłyszałem, że takie rzeczy tylko w Erze... a nie w naszym Instytucie. Widzisz, nie pozwalają nam pracować z domu :) Dobrze, że udało się założyć konto na JCR...

  • nobbynooby napisał(a) komentarz datowany na 2016/04/01 21:29:57:

    @Pi
    No to mamy z JCR. Już więcej nie spamuję.

  • adam_beast napisał(a) komentarz datowany na 2016/04/01 22:06:21:

    Ja bym wzrost cytowań korelował nie tyle wprost z reformą Kudryckiej tylko z zasadami oceny wniosków w NCN.

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/01 22:23:09:

    @adam_beast
    > Problem jest z nowymi danymi - CK w żaden sposób nie porządkuje
    > danych, które przybyły. Z tego powodu jak się raz zassa zawartość
    > to potem ciężko ogarnąć jakie postęowania się później pojawiły.


    wget jest w stanie zassać całą strukturę raz, a potem robić przyrosty różnicowe.

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/01 22:31:23:

    @trzy.14
    > celem edukacji wyższej nie jest kształcenie nauczycieli!
    > (...)
    > Cholera, jak ja mam studentów przygotować do pracy zawodowej,
    > skoro nigdy nie pracowałem poza sektorem akademickim?


    Tu nie ma sprzeczności. Jej właśnie o to chodzi! Celem edukacji WYŻSZEJ jest kształcenie nauczycieli. Dobrze przygotowanych nauczycieli ZAWODU. A nie mędrkujących sfrustrowanych filozofów.

    Jak masz przygotować? Idąc na rok do PRACY ZAWODOWEJ. Nie edukacyjnej. Nie naukowej. Ale ZAWODOWEJ. Zbierasz doświadczenia. Potem wracasz i teoretyczne mędrkowanie filtrujesz przez swoje doświadczenie. Odrzucasz nieistotne bzdety, pozostawiasz esencję.

    Ja ze współpracy z przemysłem, na poziomie eksperckim, nie naukowym, wyciągam dwie korzyści: finansową, ale przede wszystkim DOŚWIADCZENIE. Tego nie zastąpi żadne kiszenie się w sosie własnym. Z uwagi na to, że u nas w zasadzie nie ma zaplecza przemysłowego na wysokim poziomie naukowym to na razie, w horyzoncie ok. 10...20 lat powinniśmy się skupić właśnie na DOBREJ i ELITARNEJ dydaktyce zawodowej. Z dominującej części plebsu tresowanego na "studiach" licencjackich nie będzie żadnego pożytku. Niestety, ale trzeba wrócić do studiów WYŻSZYCH jako selekcji górnego odsetka intelektualnego społeczeństwa. Wiem, że to jest niepopularne politycznie, ale inaczej po prostu się nie da! Nauczanie na poziomie przyswajalnym dla 30...50% populacji jest nauczaniem ŚREDNIM!

  • klamczuchosiedlowy napisał(a) komentarz datowany na 2016/04/01 22:33:18:

    @Pi
    No to mamy z JCR. Już więcej nie spamuję

    Proszę powiedziec dla czego te wyniki? dla jednej osoby czy dla calej uczelni AGH lub innej - jakiej?

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/01 22:41:32:

    @nobbynooby
    > Informatyków pytałem o VPN już w 2011r. (uniwerek w USA, z którego
    > właśnie wracałęm, zapewniał VPN na defaulcie). Usłyszałem, że takie rzeczy
    > tylko w Erze... a nie w naszym Instytucie.


    To na szybko ściągnij sobie komercyjnego TeamViewera, odpal i zostaw na pracującym komputerze w pracy, a potem podłącz się drugim TeamViewerem z domu. Tym można wyjść zza NAT-a i firewalla, o ile nie ma jakichś "admino-faszystowskich" ustawień. Ale sądząc po braku VPN, to admini z Twojego instytutu raczej nie są na tym poziomie.

  • nobbynooby napisał(a) komentarz datowany na 2016/04/01 22:48:12:

    @klamczuch,
    To była kontynuacja poprzedniego wpisu, z danymi ze ScholarGoogle. Poprzez pokazanie, że jedna osoba może zrobić różnicę (yours truly), odnosiłem się do hipotezy #3 Pi, że być może ten jego CiekawyGranciarz też pozyskał podobnego murzyna do rozliczania grantów. Dane dotyczą mojej szefowej, FullProf. (ostatni gwizdek starego trybu).

    @Zgred,
    DZIĘKI; ciekwaych rzeczy się tu uczę ;) wget, teraz TeamViewer. ^^.

  • cutbold napisał(a) komentarz datowany na 2016/04/01 22:59:27:

    @adam_beast
    Jeżeli chodzi ci o aktualizowanie danych, które są uzupełniane na stronie CK można po prostu mieć ostatnią listę osób i sprawdzić, czy na stronie nie przybyło nowych nazwisk.
    To jest lista wszytskich osób które są na stronie CK w dziedzinie nauk humanistycznych.
    s000.tinyupload.com/index.php?file_id=56151693262166135593
    Porównanie i ściągnięcie wykonuje się stosunkowo szybko.
    Jak widać osób jest 931.
    Z mojej strony mogę dowolnie parsować stronę CK i ściągnąć dane, które są na niej dostępne. Ściąganie lokalnej kopii pdf-ów nie ma sensu (dla 150-ciu osób było już tego ponad giga). Trzeba by to było opracować na podstawie danych online.
    Jeśli jest na to zapotrzebowanie społeczne ;-) mogę "po godzinach" częściowo wyczyścić dane (jak jakieś będą) i zrobić analizę grafów powiązań pomiędzy osobami biorącymi udział w postępowaniach, powykrywać klastry itp.
    Moim zdaniem OCR tu nic nie da - jeśli są Państwo tym zainteresowani, trzeba niestety przejrzeć te postępowania i uzupełnić CSV-kę.

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/01 23:10:17:

    @cutbold
    > Moim zdaniem OCR tu nic nie da

    Zgadza się. Niezbędne będzie "rękodzieło", bo ktoś "inteligentny inaczej", na samym początku "reformy" Kudryckiej/Woźnickiego nie wpadł na pomysł, aby wykorzystać istniejący w OPI system OSF obsługujący granty MNiSW/NCN, który po minimalnych modyfikacjach mógłby kompletnie obsłużyć CK w zakresie doktoratów/habilitacji/profesur. Zamiast kuriozalnych pdf-owych skanów graficznych mielibyśmy normalne pliki nadające się do analiz treściowych.

  • cutbold napisał(a) komentarz datowany na 2016/04/01 23:33:51:

    Ostatnim momentem, w którym można było jeszcze "uratować" stronę CK było inne zaprojektowanie wgrywania plików z postępowań oraz lekka modyfikacja bazy danych. Nie widziałem interfejsu tej strony, ale widać, że do wgrywania jest formularz i informacje o poszczególnych plikach są w bazie (świadczy o tym posortowana lista postępowań według nazwisk). Każdy z rekordów bazy można najprawdopodobniej edytować dodając / modyfikując pliki na serwerze (świadczą o tym podkatalogi z literówkami w nazwiskach w ramach jednej osoby). Na tym etapie wystarczyłoby wymóc poprzez interfejs na osobie, która wprowadza dane, aby opisywała każdy plik, np. że jest to recenzja zrobiona przez taką - a - taką osobę, która wpłynęła danego dnia. Do postępowania można by dodać informację, gdzie się odbywało i z jakim skutkiem. Skład komisji to tylko 7 nazwisk. Jakby to robić na bieżąco dodanie jednego wpisu trwało by może 5 minut a nie 2. Nie chce mi się wierzyć, że nikt nie pomyślał o dodaniu najprostszych metadanych (może są, ale nieudostępnione?). Moim zdaniem koszt wytworzenia aplikacji wzrósłby nieznacznie a dawało by to na przyszłość perspektywy rozbudowania serwisu i możliwość centralnego (!) panowania nad wszystkim przez analizę danych historycznych. W obecnej postaci strona jest zupełnie niefunkcjonalna.

  • cutbold napisał(a) komentarz datowany na 2016/04/01 23:39:25:

    @staryzgred2012
    Podejrzewam, że zrobienie aktualnej strony CK było dużo tańsze niż dorobienie funkcjonalności o której mówisz do OSF. Być może na stronie CK robi się jeszcze więcej rzeczy ręcznie i to jest jeden z powodów, dlaczego tak wolno pojawiają się tam aktualizacje postępowań?

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/01 23:43:40:

    @cutbold
    > Podejrzewam, że zrobienie aktualnej strony CK było dużo
    > tańsze niż dorobienie funkcjonalności o której mówisz do OSF


    Wątpię. Zwróć uwagę, że typowy wniosek doktorski/habilitacyjny/profesorski NICZYM strukturalnie nie różni się od wniosku grantowego. Recenzje - tak samo.

    Całość modyfikacji sprowadzałaby się tylko do zmiany tytułów poszczególnych pól tekstowych.

  • cutbold napisał(a) komentarz datowany na 2016/04/01 23:56:56:

    W OSF jest jakiś CMS na podstawie którego buduje się odpowiednie moduły. Pytanie, czy szablony buduje ktoś zatrudniony "na etacie" czy zleca się to firmie. Jeśli firmie, to nie jest to tanie (choć w sumie nie wiem czy nie tańsze niż utrzymanie pełnoetatowego pracownika...).
    Z drugiej strony zrobienie strony, której jedyną funkcjonalnością jest zapytanie do bazy danych, które zwraca posortowane wyniki nie wymaga wielkich kosztów. Jeśli w zeszłym roku problemem było hostowane być może ze 50 GB danych, coś może być na rzeczy.
    Masz w pełni rację - zrobienie tego w ramach OSF było by dobrym rozwiązaniem. Ciekawe tylko, jak wyglądałaby dostępność danych - czy tak jak obecnie w grantach?

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 00:01:55:

    Zgred ma rację.
    Całą dokumentację powinno się przygotowywać w systemie podobnym do tego, jaki obowiązuje przy składaniu wniosków grantowych. CAŁĄ. Włącznie z recenzjami i decyzją RW. I protokołem z posiedzenia KH!!! Przygotowanie takiego systemu byłoby stosunkowo tanie, bo klocki są gotowe. Oczyma wyobraźni widzę nawet osobne pole na wpisanie nazwy wydawnictwa, które wydało monografię habilitacyjną/profesorską :-) Nie wiem, czy znalazłby się odważny we władzach, który by miał śmiałość zbadać statystycznie taką bazę.

    Transparency, accountability, integrity.
    Dlatego ta baza powinna być całkowicie jawna z opcją hurtowego eksportu w formacje CSV.

  • misiekc1 napisał(a) komentarz datowany na 2016/04/02 01:20:50:

    Popytalem google'a i znalazlem strone www.freeocr.net/
    Program tam umieszczony bazuje na silniku tesseract rozwijanym przez google'a
    (github.com/tesseract-ocr/tesseract) i moim zdaniem zupelnie przyzwoicie sobie radzi. Przyklad przerobionego dokumentu o powolaniu komisji: s000.tinyupload.com/index.php?file_id=11964668281852946145
    Trochę nie mam teraz czasu żeby się tym zająć, ale myślę, że jeśli przez miesiąc nikt nic nie zrobi to postaram się przygotować program/skrypt przynajmniej częściowo wypełniający tabelę cutbolda.

  • adam_beast napisał(a) komentarz datowany na 2016/04/02 09:02:42:

    @Cutbold
    Jak wygenerujesz analogiczną listę mogę w wolnej chwili zająć się naukami technicznymi, których mam spory kawałek na dysku. Przy okazji, czy nie sądzicie, że należałoby dodać jeszcze pole "Dyscyplina"? To też mogłoby coś powiedzieć.

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 11:07:53:

    Stan na marzec zeszłego roku w dziedzinie ekonomia, kiedy groziło wyczyszczenie serwera CK i zrobiłem prywatny mirror ekonomii.

    Liczba plików zal2.pdf (decyzja CK o powołaniu recenzentów): 119
    Liczba plików zal2.pdf, które poddały się wizualnie rozsądnej obróbce OCR: 118

    Liczba wystąpień słów kluczowych:
    Romanowska/Rcmancwska: 47
    Jajuga: 42
    Owsiak: 23
    Domański/Dcmański/Domanski: 37+2+1 = 40
    Borowiecki: 32
    Bratnicki: 16
    Czyżewski: 9
    Jasiczak: 20
    Jurek: 28
    Kotowska: 10
    Osiewalski: 13
    Przybylska: 4
    Stryjakiewicz: 10
    Wojtyna: 9
    Zaleska: 8

    Tak na oko średnio w postępowaniu z ekonomii występuje więc nieco ponad dwoje członków CK

    dla kontroli jakości OCR:
    przewodnicz: 112
    recenzent: 340
    sekretarz: 115
    Krak: 159
    Pozna: 163
    Wroc: 117
    Gda: 107


  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 11:18:48:

    przewodniczący komisji, alfabetycznie, 105 pozycji

    prof. Ryszard Borowiecki
    prof. Ryszard Borowiecki
    prof. Mariusz Bratnicki
    prof. Czasław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Czesław Domański
    prof. Stanisław Gosiak
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prof. Krzysztof Jajuga
    prot Krzysztof Jajuga
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Jan Jasiczak
    prof. Witold .Jurek
    prof. Witold .Jurek
    prof. WItcld Jurek
    prof. WItcld Jurek
    prof. Witold Jurek
    prof. Witold Jurek
    prof. Witold Jurek
    prof. Witold Jurek
    prof. Michał Kobusiewicz
    prof. Michał Kobusiewicz
    prof. Michał Kobusiewicz
    prof. Irena Kotowska
    prof. Jan Lichtarski
    prof. Jan Lichtarski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Bogdan Nogalski
    prof. Jacek Osiewalski
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Stanisław Owsiak
    prof. Maria Romanowska
    prof. Maria Romanowska
    prof. Maria Romanowska
    prof. Maria Romanowska
    prof. Maria Romanowska
    prof. Maria Romanowska
    prof. Maria Romanowska
    prof. Maria Romanowska
    prof. Maria Romanowska
    prof. Stanisław üwsiak
    prof. Małgorzata Zaleska
    prof. Małgorzata Zaleska
    prof. Małgorzata Zaleska

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 12:00:41:

    Ten prof. Gosiak to musi byc ktoś, skoro dali mu przewodniczenie. Ale nie, może nie mieli mocy przerobowych, bo w tym postępowaniu 2 recenzentów i członek było z CK.

    To może prof. Kobusiewicz? Ale to były 3 postępowania z archeologii, które zaplątały się w ekonomii...

    To może Lichtarski? Bingo! Jedyne postępowanie, w którym nie uczestniczyli członkowie CK (stan na okres od początku 2012 do mnie więcej 3. kwartału 2014)

  • cutbold napisał(a) komentarz datowany na 2016/04/02 12:03:33:

    @adam_beast
    Rzeczywiście, dziedzina się przyda.
    Nauki techniczne:
    s000.tinyupload.com/index.php?file_id=33058599169334084539
    Takim programem to ściągam (C# console application .NET Framework 2.0):
    s000.tinyupload.com/index.php?file_id=18080841301515192660
    Można nim ściągnąć również pdf-y postępowań, trzeba wtedy odkomentować odpowiednie linijki. Ściągnięcie samych nazwisk to kilka sekund, pdf-ów kilkanaście / dziesiąt minut. Połączenie ze stroną CK może być (i czasem jest...) niezaufane, dlatego wyłączyłem ServerCertificateValidationCallback.

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/02 12:25:24:

    @trzy.14

    Poziom obsługi serwera CK jest żałosny. Włącz sobie protokół https. Nie wiadomo, czy się śmiać, czy płakać. Certyfikat przeterminowany pół roku temu, a w dodatku przypisany tylko na domenę, bez aliasu z www.

    Do licha, za kilkaset złotych rocznie można mieć o wiele lepszy poziom obsługi w byle hostingu zewnętrznym.

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 15:08:21:

    Zgred,
    hosting zewnętrzny to firma prywatna; CK to działalność publiczna (=niepełnosprawna). Przecież nie zatrudnią informatyka, który zarabiałby więcej od nich? Jak się kiedyś dowiedziałem, za jaką pensje pracują nasi informatycy, to przestałem się czemukolwiek dziwić.

  • cutbold napisał(a) komentarz datowany na 2016/04/02 16:46:49:

    Mam same załączniki nr 2 dla panelu humanistów w formacie jpg lub tiff. Nazwy plików są takie jak nazwiska osób, których dotyczy postępowanie. To chyba nie są wszystkie postępowania (plików jest 606), ale próbka jest chyba wystarczająco liczna, aby wyciągnąć jakieś wnioski. Podejrzewam, że w Pythonie OCR tych plików zrobi się od ręki.
    Jeśli ktoś zna jakiś darmowy - anonimowy hosting, na który nie trzeba się logować i który "łyknie" 200 mega w jednym pliku (nie chce mi się archiwum dzielić na kawałki) mogę udostępnić.
    Tu jest próbka ostatniej części:
    s000.tinyupload.com/index.php?file_id=03958524668521329907

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 20:30:10:

    Nauki techniczne, przyzwoity OCR:
    s000.tinyupload.com/index.php?file_id=92708332246187829202

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 20:38:42:

    tak można zassać pliki z sekcji CK programem wget: s000.tinyupload.com/index.php?file_id=00760215522383040531

    A tak zrobić przyzwoity automatyczny OCR:
    s000.tinyupload.com/index.php?file_id=74751914579188224169

    (Linux)

  • cutbold napisał(a) komentarz datowany na 2016/04/02 21:04:26:

    @trzy - super!
    Ja zrobiłem OCR nauk humanistycznych (załącznik 2)
    s000.tinyupload.com/index.php?file_id=78441543424509835667
    Pod Windowsa jako OCR polecam
    sourceforge.net/projects/tesseract-ocr-alt/files/
    pakiet z językiem polskim
    packages.ubuntu.com/pl/precise/graphics/tesseract-ocr-pol
    plik bat do przetworzenia wsadowego wszystkich skanów
    s000.tinyupload.com/index.php?file_id=39751702578060515547
    instrukcja, jak go modyfikować
    digitalaladore.wordpress.com/2014/11/17/using-tesseract-via-command-line/

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/02 21:53:59:

    @trzy.14, @cutbold

    I w ten sposób, zanim nastanie nowy tydzień, CK będzie przerobione do formy parsowalnej. A zanim minie kolejny tydzień wszystkie powiązania koterii, klik i kamaryl będą odsłonięte jak na dłoni.

    Oj, to pospolite ruszenie. Takie niepozorne, a takie niebezpieczne.

  • cutbold napisał(a) komentarz datowany na 2016/04/02 21:56:09:

    CSV z nauk technicznych (483 pozycje) zrobiona na podstawie danych od @trzy.14. Należałoby jeszcze odsiać tytuły i przyklejone afiliacje. Kolejne kolumny w dokumencie to:
    habilitant przewodniczacy sekretarz recenzent1 recenzent2 recenzent3 czlonek1 czlonek2
    Parsowanie było robione programem w C#, więc źródła programu nie będą pewnie zbyt użyteczne.
    s000.tinyupload.com/index.php?file_id=72147233693972560332

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 21:59:59:

    Zgred,
    Z pewnym marginesem błędu, bo oni tam mają straszny b...; np. pliki osoby NN w katalogu osoby MM.

  • adam_beast napisał(a) komentarz datowany na 2016/04/02 22:02:21:

    @cutbold
    Hosting na duże rzeczy z szyfrowaniem: mega.nz jedyna wada, że interfejs webowy we flashu i nie działa za dobrze w safari (reszta przeglądarek działa).
    @trzy.14
    Dzięki za OCR, będzie łatwiej

  • adam_beast napisał(a) komentarz datowany na 2016/04/02 22:03:53:

    @cutbold
    Szybki jesteś to mi się robota zmniejszyła :)

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 22:09:38:

    cutbold,
    Aleś się szybko uwinął.
    Ale w technicznych kluczowa wydaje się jeszcze kwestia dyscypliny, bo oczywiście nie ma grup trzymających jednocześnie architekturę i elektronikę, ale poszczególne dyscypliny - czemu nie?

    A jeśli robisz OCR w tesseract (ja też), to on jest b. wrażliwy na plik wejściowy. Moje eksperymenty wskazują, że dobrze spisuje się png w odcieniach szarości (8 bit) i rozdzielczości 600 dpi. To, że kiedyś miałem słabe wyniki w OCR, wynikało najprawdopodobniej z niewłaściwej obróbki pliku wejściowego (tesseract nie potrafi obsłużyć pdf-ów), czego nie byłem świadom.

  • cutbold napisał(a) komentarz datowany na 2016/04/02 22:23:35:

    @trzy.14
    Twój format pliku (jeden plik ze wszystkim postępowaniami, osoby oddzielone ====) jest wygodniejszy w przetwarzaniu niż mój (dużo pojedynczych plików). Graficzne pliki, które wrzuciłem na serwer to po prostu rysunki, które były w pdf. Znalazłem bibliotekę, która wyciąga części składowe pdf-a (tekst, rysunki) i napisałem program, który ściąga pdf-y, wyciąga pliki graficzne i zapisuje na dysku. W jakieś 15 minut jestem wstanie ściągnąć jedna dziedzinę. Jeśli coś jest jeszcze potrzebne, będę mógł to zrobić - wykorzystam do przekazania portal, o którym pisał @adam_beast.
    Dyscyplinę ciężko sparsować, bo nazwy mogą być kilkuczłonowe, ale chyba nazwa dyscypliny znajduje się zawsze pomiędzy słowem "dyscyplinie" a kropką ".". Zobaczę, co się da zrobić.

  • cutbold napisał(a) komentarz datowany na 2016/04/02 22:35:02:

    Jest już dyscyplina - nazwy są niestety dość zaśmiecone. Fajnie byłoby, jakby jakaś dobra dusza przeglądnęła plik i poprawiła ewentualne literówki. To chyba dość trudno zrobić automatycznie.
    s000.tinyupload.com/index.php?file_id=36348774028490428642

  • cutbold napisał(a) komentarz datowany na 2016/04/02 23:19:34:

    Tak mniej więcej wygląda graf postępowań habilitacyjnych w naukach technicznych:
    s000.tinyupload.com/?file_id=00011791727987287739
    Wierzchołki to osoby biorące udział w postępowaniach (zarówno komisja jak i habilitowani). Krawędzie łączą wszystkich uczestników postępowania (każdego członka komisji z pozostałymi i z habilitowanym). Graf jest nieskierowany.
    Kolory oznaczają grupy (communities wykryte) algorytmem:
    Vincent D Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre, Fast unfolding of communities in large networks, in Journal of Statistical Mechanics: Theory and Experiment 2008 (10), P1000
    Im większy jest wierzchołek grafu, tym większy stopień wierzchołka (tym więcej połączonych jest z nim pozostałych wierzchołkach). Czyli: im większy wierzchołek tym w większej ilości postępowań występuje dana osoba.
    Oczywiście dane są niepełne i zaszumione literówkami - ocenę, co wyszło zostawiam dyskutantom :-)
    Wizualizacja zrobiona w gephi.org/
    Plik źródłowy dla gephi (gdf):
    s000.tinyupload.com/index.php?file_id=00296577809124527265
    Polecam samodzielne wygenerowanie grafu!

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 23:35:02:

    inżynieria środowiska = prof. Janusz Jeżowiecki, co najmniej 45 postępowań, przewodniczący lub sekretarz

  • trzy.14 napisał(a) komentarz datowany na 2016/04/02 23:42:36:

    Graf cutbolda robi lepsze wrażenie niż moje liczby:

    11 Andrzej Noworyta
    11 Leopold Jeziorski
    12 Janusz Kacprzyk
    12 Tomasz Suchecki
    14 Mieczysław Gostomczyk
    15 Ryszard Tadeusiewicz
    16 Józef Gawlik
    16 Józef Korbicz
    17 Jerzy Klamka
    23 Janusz Mroczka
    45 Janusz Jeżowiecki

    Liczby to minimalne liczby postępowań hab., w których uczestniczyła dana osoba. Osoby z dołu tabeli są członkami CK - co za koincydencja. Liczby rzędu 10 nie wydają się rażące - chyba że w dyscyplinie odbyło się 20 postępowań, czego nie wiem.

    (Z drugiej strony tworzenie się klastrów na wykresie jest naturale, bo nauki techniczne nie są homogeniczne).

  • adam_beast napisał(a) komentarz datowany na 2016/04/02 23:42:44:

    Mam dziwne wrażenie, że te wykryte grupy się pokrywają z dyscyplinami. I tak np Automatykę trzymają Klamka, Tadeusiewicz, Korbicz, Kacprzyk (wszystko członkowie PAN)

  • cutbold napisał(a) komentarz datowany na 2016/04/02 23:43:38:

    @trzy.14
    Być może powinno się dodać wagi do krawędzi, proporcjonalne do ilości postępowań w danej dyscyplinie (w tej chwili krawędzie nie są ważone). Pokazywało by to najważniejsze wierzchołki biorąc pod uwagę różne ilości postępowań w dyscyplinie. Ale to może w wersji 2.0 albo w kolejnych dziedzinach, o ile będzie na to zapotrzebowanie ;-)

  • cutbold napisał(a) komentarz datowany na 2016/04/02 23:46:36:

    @adam_beast
    Jeżeli grupy pokrywają się z dyscyplinami, to znaczy, że model w miarę wiernie odwzorowuje rzeczywistość :-)

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 00:01:26:

    elektronika (30) = Mroczka (23) + Rogalski (6), obaj z CK; chyba tylko 4 postępowania z elektroniki są bez kogoś z CK w komisji.

  • cutbold napisał(a) komentarz datowany na 2016/04/03 00:16:39:

    @trzy.14
    Tu jest wersja z wagami krawędzi, które są równe 1/ilość postępowań w dyscyplinie.
    s000.tinyupload.com/index.php?file_id=27447175091706839805
    Oczywiście dyscypliny też mają literówki, więc kumuluje to błędy OCR-a i parsowania. Ale teraz graf wydaje mi się nieco czytelniejszy.

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 00:22:49:

    @adam_beast,
    Zajrzałem na prof. Klamkę (z szacunku dla naszego forumowego Klamczuchaosiedlowego, którego nick wywodzi się od klamki ;-) ), bo zdziwiło mnie, że memy tylu automatyków. Oto jego specjalizacje w komisjach habilitacyjnych (w których występuje wyłącznie jako przewodniczący):
    - automatyka i robotyka +++++++
    - informatyka ++++++++
    - biocybernetyka i inżynieria biomedyczna +
    - transport ++

    Dziwne powinowactwo zainteresowań i zdolności z Ryszardem T., z wyjątkiem tego transportu, który w połączeniu z biocybernetyką wprawia w osłupienie ale tylko ze względu na oryginalność i innowacyjność tego połączenia: przecież swobodny przepływ między robotyką, biocybernetyką i informatyką od lat nikogo nie dziwi (bo "wszystkie Ryśki to fajne chłopaki")

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/03 00:41:30:

    I należy pamiętać, że mamy ostre niedoszacowanie, gdyż graf obejmuje WYŁĄCZNIE postępowania według nowej procedury. Więc nasz "diament polskiej automatyki" wychodzi tak skromnie.

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 00:43:58:

    Nie każdy może wie, ale te pdf-y cutbolda można swobodnie powiększać (zoom) bez utraty wierności obrazu. Polecam rolka, ctrl+rolka oraz shft-alt-rolka do wygodnej nawigacji sama myszką.

    Tam widać galaktyki ale i samotne jakieś takie jakby planety lub układy podwójne. Skąd one? W biotechnologii jako dyscyplinie nauk technicznych odbyły się dotąd zaledwie 2 (DWA) postępowania habilitacyjne (+- OCR i CK). Innym czynnikiem mogą być przekłamania OCR.

  • cutbold napisał(a) komentarz datowany na 2016/04/03 00:49:17:

    Gephi jest świetnym programem, ponieważ generuje rysunki wektorowe. Co więcej, można też wyszukiwać interesujące nas osoby - w Acrobat Readerze Crl + F. Tu jest jeszcze wersja brzydsza, mniej "gazetowa", ale może jeszcze bardziej czytelna:
    s000.tinyupload.com/index.php?file_id=54234768075707139949

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 00:53:19:

    Zgred,

    I Rudek jest, i Wiliński...

    Z Wilińskim wyszła ciekawa sprawa: ten sam załącznik 2 wstawiono do dokumentacji Jerzego Czekalskiego, Izabeli Czekaj i Pawła Czarnula.

  • nobbynooby napisał(a) komentarz datowany na 2016/04/03 01:00:23:

    STRASZNIE fajną robotę zrobiliście. Szczególnie zważenie tego liczbą postępowań w dyscyplinie daje lepszy wgląd.
    Pytanie teraz, kto by wam to w kraju odważył się opublikować - szczególnie jeśli dołączyłyby pozostałe dziedziny. ;)

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 01:05:29:

    cutbold,
    Możliwość przeglądania nazwiskami jest tak interesująca, że na noc zapuściłem nauki fizyczne i jutro będę prosił o małą przysługę :-)

  • cutbold napisał(a) komentarz datowany na 2016/04/03 01:12:03:

    @trzy.14
    Nie ma sprawy - jak będzie CSV-ka podobna do tamtej mam już gotowy program.
    Ciekawy jestem innych też dyscyplin, na przykład takich, o których często dyskutuje się na tym blogu. Ciekawość oczywiście czystko naukowa :-)

  • cutbold napisał(a) komentarz datowany na 2016/04/03 01:17:10:

    @nobbynooby
    Myślę, że to już zostało opublikowane. Jeżeli ten blog ma 12-15 tysięcy wejść miesięcznie to jest dużo bardziej poczytny niż przeciętna publikacja naukowa. O CSV do pozostałych dziedzin trzeba prosić @trzy ;-)

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 01:19:11:

    Ja nie potrafię zrobić CVS; ja tylko OCR do pliku tekstowego...

  • cutbold napisał(a) komentarz datowany na 2016/04/03 01:33:05:

    @trzy.14
    Tak, o to mi chodziło.

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 01:34:37:

    nobby,
    Po pierwsze, w Polsce nie publikujemy niczego naukowego...
    Po drugie, o ile cutblod najwyraźniej ma doświadczenie w analizie grafów i sieci powiązań, dla mnie to tylko pozanaukowa zabawa.
    Po trzecie, coś z tym wypadałoby zrobić, tylko najpierw trzeba zwerbalizować "to coś". "Impact".
    Po czwarte, interpretację surowych danych wypadałoby zlecić jakiemuś społ-humowi, tak na mojego nosa, najlepiej z doświadczeniem w badaniu system(u/ów) SzWiN.
    Po piąte, podejrzewam, że jeśli ktoś decyzyjny miałby się zainteresować wnioskami, to tylko jako narzędziem do uzasadnienia swojej wizji "dobrej, marcowej zmiany" - niezależnie od opcji politycznej. Przecież naprawdę celnych uwag o kondycji polskiej nauki wygłaszano tak wiele, z tak nikłym przełożeniem na rzeczywistość, że aż się odechciewa.
    Po szóste jednak, precz z defetyzmem! Publikacji naukowej nikt nie zauważy, ale publikację "zaangażowaną społecznie" w j. polskim - czemu nie? Tylko gdzie jest zwerbalizowany "Impact"?

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 01:43:43:

    I czy można mieć "Impact" po dniu zabawy?
    Przecież gdyby to potraktować poważnie, wypadałoby przeanalizować wszystkie dyscypliny. Dołączyć docentkę, która prawdopodobnie mogłaby coś podobnego zrobić na słowackich serwerach, o ile są równie "świetnie" zabezpieczone jak nasze (np. juz nasze OPI broni się przed automatami, ale chyba umiałbym ich zabezpieczenia obejść, choć z drugiej strony to są informacje publiczne więc po co te zabezpieczenia obchodzić?). Może dałoby się uzyskać dane dla jakiegoś rozwiniętego kraju o podobnej do Polski wielkości. Dopiero wtedy można by się pokusić o werbalizację "Impactu". Tylko kto z nas ma tyle czasu?

  • cutbold napisał(a) komentarz datowany na 2016/04/03 01:54:02:

    @trzy.14
    Masz rację, to całkowicie techniczna zabawa w której mam trochę wprawy. Zresztą bardzo dobrze płatna zabawa. Interesujące są wnioski ja takich nie podejmuję się tu wyciągać.
    Dziedzina nauk humanistycznych:
    s000.tinyupload.com/index.php?file_id=00448375650977902642

  • cutbold napisał(a) komentarz datowany na 2016/04/03 02:20:22:

    Ekonomia
    s000.tinyupload.com/index.php?file_id=33589898902322730914

  • cutbold napisał(a) komentarz datowany na 2016/04/03 02:30:50:

    CSV dla ekonomicznych:
    s000.tinyupload.com/index.php?file_id=07998685904593779276
    CSV dla humanistycznych:
    s000.tinyupload.com/index.php?file_id=05710234098514622425
    CSV dla fizycznych:
    s000.tinyupload.com/index.php?file_id=64499514945979522057
    Graf dla fizycznych:
    s000.tinyupload.com/index.php?file_id=94325241179039145888

  • charioteer1 napisał(a) komentarz datowany na 2016/04/03 03:04:40:

    Re: humanisci
    Widac wyraznie, ze humanistyka rozpada sie na wyspy, ktore maja ze soba niewiele wspolnego i rzadko ze soba gadaja. Na dole od lewej dwie duze wyspy obok siebie to jezykoznawstwo i literaturoznawstwo. Duza wyspa na dole po prawej to historycy. Dwie male wyspy na gorze to archeologia i filozofia.

  • cutbold napisał(a) komentarz datowany na 2016/04/03 04:39:42:

    Pojedyncze archiwum z CSV, gdf oraz grafami dla ekonomii, fizyki, humanistyki, matematyki, medycyny, prawa, społecznych, technicznych. Skala, w której wyświetlone są wierzchołki różni się pomiędzy grafami i dobrana jest ze względu na ilość postępowań w dyscyplinie. Miłej zabawy!
    s000.tinyupload.com/index.php?file_id=08480038919736264441

  • adam_beast napisał(a) komentarz datowany na 2016/04/03 07:49:00:

    @cutbold
    Super imponująca robota. A czym się różni nowy graf nauk technicznych od poprzedniego?

  • cutbold napisał(a) komentarz datowany na 2016/04/03 11:03:50:

    @adam_beast
    Nie wiem o którym poprzednim mówisz - prawdopodobnie kolorami, może być obrócony względem "środka masy" i zamiast zakrzywionych krawędzi pewnie ma proste.

  • nobbynooby napisał(a) komentarz datowany na 2016/04/03 11:14:51:

    Cutbold:

    CZAD; wielkie dzięki za Twoje zaangażowanie. Wszystkie te grafy są już ważone liczbą postepowań, prawda?

  • cutbold napisał(a) komentarz datowany na 2016/04/03 11:18:19:

    @nobbynooby
    Tak, są ważone liczbą postępowań. Aby mieć wartości liczbowe, proszę zerknąć do plików dat. Tak jak dyskutowaliśmy, pomiary mogą być obarczone błędami OCR. Nie są to również pełne dane, ale na pewno co najmniej 50%-75% dla każdej dyscypliny

  • dala.tata napisał(a) komentarz datowany na 2016/04/03 11:24:49:

    Niesamowicie ciekawe dane, przynajmniej te w pdfach (inne pliki mi sie nie chca otworzyc). Bedzie o czym dyskutowac.

  • cutbold napisał(a) komentarz datowany na 2016/04/03 11:27:24:

    @cutbold
    Plik dat to plik tekstowy. Każda linijka to jedno postępowanie. Pierwsza linijka ma nazwy kolumn. Kolumny oddzielone są od siebie tabulatorami. Można je zaimportować np. do excala albo otworzyć w dowolnym edytorze tekstu (notatnik itp).
    Pliki gdf to pliki z grafami do gephi - polecam zainstalować ten program i tam obejrzeć te grafy.

  • dala.tata napisał(a) komentarz datowany na 2016/04/03 11:30:45:

    Chario. mnie zupelnie nie dziwi, ze humanistyka to wyspy, zarowno nauki humanistyczne, jak i spoleczne. Przeciez psychlogia, pedagogika, socjologia i obronnos nie maja nic wspolnego ze soba.

    To, co mnei przeraza w tych grafach, to dominacja ilus tam osob. Realistycznie, mowimy w humanistyce o kilkunatu osobach, ktore maja wplyw na cale dyscypliny.

    Co ciekawe tez postrzegany power danej osoby wcal enie musi sie laczyc z wplywem habilitacyjnym. dobrze to widac w psychologii.

  • dala.tata napisał(a) komentarz datowany na 2016/04/03 11:40:03:

    @cutbold, bardzo dziekuje za info! super.
    no i dziekuje za wykonana prace!

  • kragon napisał(a) komentarz datowany na 2016/04/03 12:09:15:

    Swietna robota!
    Wielkie dzieki :-)
    Czy mozna poprosic o nauki chemiczne?
    Z gory dziekuje.

  • nobbynooby napisał(a) komentarz datowany na 2016/04/03 12:55:52:

    @cutbold
    Dzięki za komentarz.
    Ze swojej strony, chciałbym obejrzeć nauki przyrodnicze i rolnicze ;)

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 13:13:41:

    No i z wnioskami trzeba byc ostrożnym.
    W fizyce wybija się Marek Trippenbach, jednak
    a) chciałbym mieć taki dorobek naukowy, jak on,
    b) w zdecydowanej większości postępowań uczestniczył jako sekretarz, z wyboru własnej jednostki, która przeprowadzała przewód (i której jest prodziekanem ds badań naukowych).

    Poza tym w fizyce nie widać GTW. Nie jest tak, jak w ekonomii, gdzie jedna osoba kontroluje połowę postępowań w całej dziedzinie, czy naukach technicznych, gdzie jedna osoba może kontrolować praktycznie całą dyscyplinę. W fizyce grona tworzą się raczej na zasadzie wspólnych zainteresowań.

  • dala.tata napisał(a) komentarz datowany na 2016/04/03 13:32:21:

    Pi, jasne, ze trzeba byc ostroznym i na pewno mozna by wiele rzeczy niuansowac. Jednak roznica miedzy ekonomia i fizyka jest ogromna i ta roznica jest znaczaca i wiele mowi o statusie polskiej fizyki i ekonomii. Innymi slowy dane te to ciekawy kontekst dla tego, co 'po prostu widac'

    Wiesz, gdyby sie okazalo w danych, ze naczelny pedagog kraju nie istnieje w pedagogice, to ja bym sie zastanawial. Jednak on istnieje, my wiemy, ze istnieje. Treaz tez wiemy, jak bardzo pedagogice jest potrzebny!

  • dala.tata napisał(a) komentarz datowany na 2016/04/03 13:34:15:

    Do tych danych dodalbym jeszcze tylko jedna rzecz. Otoz, warto by bylo przelozyc 'impakt' na 'impakt finansowy'. przeciez ci ludzie zarabiaja potezna forse! Co zreszta juz kiedys omawialismy w odniesieniu do Ryszarda T., tytana pracy recenzyjnej.

  • charioteer1 napisał(a) komentarz datowany na 2016/04/03 13:44:17:

    To, co ja widze w humanistyce, tak intuicyjnie, bez sprawdzania:

    a/ niektore dyscypliny sa zdominowane przez CK, inne mniej. Bierze sie to stad, ze np. w jezykoznawstwie czlonek CK przewodniczy zawsze, w literaturoznawstwie czesto prewodniczy kto inny.

    b/ czlonkowie CK nie sa sobie rowni pod wzgledem sily oddzialywania - wybijajacych sie wizualnie nazwisk jest duzo mniej, niz liczy sekcja.

    c/ po powiekszeniu wykresu widac wyraznie, kto ma dobre dojscia w CK, a kto nie ma ich wcale.

  • ford.ka napisał(a) komentarz datowany na 2016/04/03 13:44:28:

    Wydziałów, w których prodziekan, ogłaszając proponowany skład komisji habilitacyjnej, kończy słowami, "sekretarzem jak zwykle będę ja" jest więcej. A za co mają kupić dzieciom mieszkania/samochody/inne?

  • charioteer1 napisał(a) komentarz datowany na 2016/04/03 13:53:07:

    Dala, widac, jak bardzo archeologowie sa odrebni od historykow i to jest niespodzianka. Z drugiej strony masz jednak duzo powiazan miedzy jezykoznawcami a literaturoznawcami i to tez troche dziwi w tym kontekscie. Archeologia z historia i jezykoznawstwo z literaturoznawstwem zazwyczaj sa na tych samych wydzialach.

  • charioteer1 napisał(a) komentarz datowany na 2016/04/03 13:56:14:

    Ford, po zapoznaniu sie z praktyka KH moge powiedziec, ze wladza sekretarza jest ogromna. To sekretarz decyduje, co znajdzie sie w protokole i o czym dowie sie RW.

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 14:12:33:

    Z tych danych można wyczytać też i inne sprawy, np. bardzo słabą obecność Wrocławia w postępowaniach z fizyki i astronomii (UWr + PWR + INTiBS łącznie brało udział w mniejszej liczbie postępowań niż UAM czy Toruń) czy też nadreprezentację Lublina (czy dlatego, że Lublin ma fizyka w CK?)

  • cutbold napisał(a) komentarz datowany na 2016/04/03 15:41:26:

    @kragon
    biologiczne, chemiczne, ekonomiczne, fizyczne, humanistyczne, matematyczne, medyczne, prawne, rolnicze, społeczne, techniczne.
    Jakby ktoś jeszcze chciał którąś z dziedzin proszę dawać znać.
    s000.tinyupload.com/index.php?file_id=19050105654013917644

  • kragon napisał(a) komentarz datowany na 2016/04/03 16:15:31:

    cutbold,
    Wielkie dzieki :-)
    Wyglada na to, ze nauki biologiczne i chemiczne (kazda z osobna\) wykazuja dosc dużą spojnosc.
    Choc i tu (zwlaszcza w chemii) widac olbrzymia dominacje czlonkow CK.

    Tak poza tym: rozumiem ze to jest jedynie na podstawie przewodow habilitacyjnych.
    Wazne sa jednak tez (z uwagi na tzw "wpływ na rozwoj kadry" jak to nazywa diament RT) recenzje profesorskie (poki co w niewielkim stopniu nowego trybu ujawnione) oraz recenzje dla CK przy postepowaniach profesorskich - to chyba w tych ostatnich byłoby widac bardziej "wplyw na (niedo)rozwoj dyscypliny"

  • kragon napisał(a) komentarz datowany na 2016/04/03 16:18:08:

    @trzy.14
    w fizyce widac mala obecnosc Wrocłąwa, zwłaszcza bardzo dobrego ale i bardzo wymagajacego Redlicha - czyzby był zbyt wymagajacy? i dlatego rzadko powolywany?

  • cutbold napisał(a) komentarz datowany na 2016/04/03 16:46:50:

    @kragon
    Te grafy można interpretować jako agregacje po osobach na zbiorze postępowań habilitacyjnych z ważonymi składnikami sum względem dziedzin. Nie mam wiedzy we wszystkich dyscyplinach, ale te, które znam stworzyły ładne klastry względem dziedzin.
    Jeśli będą kolejne dane np. z wynikami postępowań, afiliacjami, dorobkami itp. będzie można pokusić się o bardziej złożoną analizę, może nawet o odkrycie jakiejś wiedzy ;-) Na razie na tyle krawiec kraje na ile mu materii staje.

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/03 20:29:41:

    @cutbold
    > Jakby ktoś jeszcze chciał którąś z dziedzin proszę dawać znać

    Prośba: czy mógłbyś zobrazować nauki medyczne?
    Z pewnych przyczyn mocno mnie interesują.

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/03 20:42:37:

    @cutbold

    Przepraszam za zamieszanie, ale dopiero teraz zauważyłem, że w ostatnio udostępnionym pliku zamieściłeś nauki medyczne. Jednak tam nie ma osób, które mnie interesują. Prawdopodobnie, z uwagi na rozproszenie interdyscyplinarne, wylądowały w naukach biologicznych, więc korygują moją prośbę: o nauki biologiczne.

  • dala.tata napisał(a) komentarz datowany na 2016/04/03 21:45:12:

    Zgred, biologiczne juz sa chyba.

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/03 22:58:04:

    Dzięki @dala, wreszcie ich znalazłem: dziedzina nauk farmaceutycznych.
    Ależ ich rzuciło w dziwne miejsce.

    No to jeszcze raz uderzam z prośbą do @cutbolda: nauki farmaceutyczne.
    Teraz posprawdzałem dwa razy, aby nie prosić o już udostępnione. Farmaceutycznych nie znalazłem.

  • cutbold napisał(a) komentarz datowany na 2016/04/03 23:42:15:

    Proszę bardzo. W bonusie przesyłam WSZYSTKIE 22 dyscypliny w jednym archiwum (tak Zgredzie - udało się nawet przed końcem tygodnia ;-) ). Jeśli kogoś nie ma, mógł się nie sparsować (na przykład pdf w załączniku numer 2 miał więcej niż jedną stronę, nawalił OCR, plik graficzny w pdf-ie nie był ani jpg ani tiff) - te wszystkie techniczne problemy mogły ewentualnie wystąpić.
    s000.tinyupload.com/index.php?file_id=00005459829724186257
    Mam nadzieję, że dane i ich wizualizuje będą pomocne w analizie choć części tego, co znajduje się obecnie na stronach CK :-)

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 23:47:19:

    cutbold,
    A czy jakoś poradziłeś sobie z tym, że kilka procent plików "zal2.pdf" ma kilka stron i tylko pierwsza z nich ma użyteczną treść?

  • trzy.14 napisał(a) komentarz datowany na 2016/04/03 23:56:19:

    cutbold,
    w fizycznych masz 109 rekordów, a w rzeczywistości ich jest ok. 200. W szczególności nie masz nikogo po literze T.

  • cutbold napisał(a) komentarz datowany na 2016/04/03 23:58:10:

    @trzy.14
    Tak jak pisałem w poprzednim poście - zignorowałem. Tych postępowań nie biorę pod uwagę. Jak dostanę grant z NCBiR na digitalizację zasobów CK to będę rozpatrywał takie niuanse :-)

  • cutbold napisał(a) komentarz datowany na 2016/04/04 00:05:54:

    @trzy.14
    Jest na przykład Mieczysław Zielczyński. Tak jak pisałem - jest pomiędzy 50% a 75% danych. Teraz należałoby zatrudnić moderatorów, którzy będą poprawiali literówki w OCR-ach. Ja na to budżetu niestety nie mam :-)

  • trzy.14 napisał(a) komentarz datowany na 2016/04/04 00:08:18:

    Leśnicy trzymają się mocno!

    Po co aż dwóch leśników w CK, skoro jak dotąd (w nowej procedurze) obsłużyli raptem z 20 postępowań?

  • staryzgred2012 napisał(a) komentarz datowany na 2016/04/04 00:12:17:

    @cutbold
    > W bonusie przesyłam WSZYSTKIE 22 dyscypliny w jednym archiwum

    Wielkie dzięki.

    > (tak Zgredzie - udało się nawet przed końcem tygodnia ;-) ).

    Wyobrażam sobie jutrzejszy stres wśród członków CK, szczególnie tych dominujących, gdy dotrze do nich wieść o tej digitalizacji i obrazowaniu. A dotrze na pewno, gdyż wieści od wczoraj daaaleko poszły w świat, a dziś docierały już do mnie jakby z drugiej strony globu.

    > Jak dostanę grant z NCBiR na digitalizację zasobów CK to będę
    > rozpatrywał takie niuanse


    No to wskazówka, ile żądać: instytut Wałęsy dostał na digitalizację swoich zasobów ponad 0,5 mln zł. To nie była finezja, gdyż to nie Muzeum Narodowe, a ponadto sporo rzeczy wytworzonych po roku 1990 i tak jest już w formie cyfrowej. Robota jednak nie została wykonana. Ba! Ona nawet nie została zaczęta. Ostatnio ujawniono, że termin wykonania został prolongowany o dwa lata, na koniec 2017.

  • trzy.14 napisał(a) komentarz datowany na 2016/04/04 00:20:07:

    Cutbold,
    Czyli problem jest w automatycznym parsowaniu treści plików tekstowych?

  • cutbold napisał(a) komentarz datowany na 2016/04/04 00:33:00:

    @staryzgred2012
    Dzięki za info - za mniej raczej się tego nie opłaca tego robić.

    Pewnie takie pytanie padnie, więc je uprzedzam:

    1. Klastry oznaczone kolorami zostały wykryte algorytmem:
    Vincent D Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre, Fast unfolding of communities in large networks, in Journal of Statistical Mechanics:
    Theory and Experiment 2008 (10), P10008, DOI: 10.1088/1742-5468/2008/10/P10008
    zaimplementowanym według:

    R. Lambiotte, J.-C. Delvenne, M. Barahona, Laplacian Dynamics and Multiscale Modular Structure in Networks, IEEE Transactions on Network Science and Engineering (Volume:1 , Issue: 2 ) pp. 76-90, 2015, DOI: 10.1109/TNSE.2015.2391998

    2. Układ grafu został wygenerowany algorytmem:
    Mathieu Jacomy , Tommaso Venturini, Sebastien Heymann, Mathieu Bastian, ForceAtlas2, a Continuous Graph Layout Algorithm for Handy Network Visualization Designed for the Gephi Software, PLoS One. 2014 Jun 10;9(6):e98679. doi: 10.1371/journal.pone.0098679. eCollection 2014

    Ciekawy jestem swoją drogą - i tu pytanie do osób znających poszczególne dziedziny - na ile ten model wiernie odwzorowuje rzeczywistość? Ciekawe są szczególnie te dyscypliny, gdzie graf nie został podzielony na w miarę luźno połączone podgrafy jak to ma miejsce na przykład w naukach społecznych o czym pisał wcześniej dala.tata.

    @trzy.14
    Problemy, które mogły wystąpić (tak na gorąco, bo nie bardzo mam czas już nad tym aktywnie siedzieć):
    - błędny OCR - popatrz na przykład na imię Andrzej - prawie zawsze jest rozpoznane jako "Anzej" (!). No ale OCR jest darmowy...
    - zakładałem z tego co pamiętam, że miejsce, w którym podani są członkowie komisji ma rozdzielone funkcje w postępowaniu od danych osobowych płazą "-". Okazało się to w dużej części przypadków prawidłowym przypuszczeniem.
    - Odnajdowanie pozycji, w którym jest linijka dotyczące komisji rozpoznawana jest fragmentem słów np. "przewod" - przewodniczący. Na tym OCR nie da się raczej brać pod uwagę dłuższych napisów bo wyraz "przewodniczący" ma "ą" i jest dość długi i często w nim jest błąd.
    Takich niuansów jest mnóstwo - pewnie części nawet nie jestem świadomy.
    --------------------
    Proszę pamiętać:

    Dane i wykresy mają charakterter poznawczy, mogą być obciążone różnorodnymi błędami zawinionymi na przykład przez software z którego kożystałem. Z tego powodu nie biorę za nie żadnej odpowiedzialności. Nie należy ich traktować jako pełne oraz pewne źródło informacji przy podejmowaniu decyzji, stawieniu diagnoz, wygłaszaniu opinii itd.
    Dane mają charakter otwarty i zostały sporządzone na podstawie powszechnie dostępnych danych na serwerze www.ck.gov.pl/

    Ta ostatnia informacji tak na wszelki wypadek - skoro tyle osób się nimi interesuje...

  • trzy.14 napisał(a) komentarz datowany na 2016/04/04 00:46:22:

    Z pozdrowieniami dla Zgreda, czołówka nauk farmaceutycznych:

    7 Stanisław Ryng
    8 Franciszek Sączewski
    9 Jan Krzek
    9 Stanisław Boryczka
    10 Elżbieta Mikiciuk
    10 Jerzy Pałka
    12 Maciej Pawłowski
    13 Zenon Kokot
    16 Piotr Szefer
    25 Jan Pachecka

    Dokładność szacuję na ponad 95%.
    (w szczególności skanuję zalącznik 2 jeśli ma on 1-3 strony oraz załącznik1 jeśli załacznik 2 ma co najmniej 4 strony, co oznacza recenzję)

  • trzy.14 napisał(a) komentarz datowany na 2016/04/04 00:50:03:

    cutbold,
    wow, jesteśmy (tu) dzięki tobie na cutting-edge! Algorytmy z pism za 35-40 kudryków! I świeżutkie jak ciepłe bułeczki!

Dodaj komentarz

Kanał informacyjny

Czytam

Warsztat badacza

Dariusz Galasiński - Blog

Graham Scambler - Blog

LSE - Blogs

Piotr Stec

language: a feminist guide