Archivi tag: Medicina

I Farmaci Più Distribuiti In Italia

“Lo sai che la Tachiprina 500
Se ne prendi due diventa mille
Si vede che hai provato qualcosina parlano
Parlano le tue pupille
E adesso che mi prendi per la mano vacci piano
Che se mi stringi così”

-Calcutta

Il Ministero della Salute ha un set di open data sui farmaci più distribuiti, così questa mattina ho deciso di studiarlo (trovate qui il dataset)

Anticipo che dal punto di vista metodologico ho aggregato tutti i farmaci che avessero lo stessa parola iniziale.

Ad esempio la Tachipirina è stata aggregata in un’unica variabile sia che fosse da 500, sia da 1000, per via orale e supposte.

Per motivi di tempo ho potuto indagare quali di questi farmaci fossero anche sponsorizzati in TV. C’è una variabile categorica “Modalità” che può assumere o il valore “SOP”(Senza Obbligo di Ricetta”) o OTC (Over The Counter) farmaci da banco o di automedicazione per i quali è prevista pubblicità.

Nel prossimo post approfondirò la relazione tra il consumo di farmaci e la loro sponsorizzazione in TV.

I primi 5 farmaci con il più alto tasso di distribuzione in Italia nel primo semestre 2016 sono stati la Tachipirina(8+Mil di confezioni), l’Enterogermina(3+Mil di confezioni), il Voltaren, la Rinazina e l’Aspirina.

Sempre per chiarezza metodologica “Glicerolo“, sono le supposte Carlo Erba.

I farmaci più venduti in Italia

80% del tempo è stato impiegato per la pulizia del dataset.

Nello specifico ho dovuto saltare le prime righe perché si presentavano come vedete in foto.

Inoltre la tabulazione non era codificata secondo ‘utf-8’ ma ho dovuto utilizzare la “ISO-8859-1” ed al posto della virgola il separatore utilizzato era ‘;

I valori numerici dei quantitativi distribuiti erano nel seguente formato “1.000.000” è stato necessario rimuovere con una funzione il punto per poter convertire la stringa in numero.

A questo link trovate una domanda di stack overflow che mi ha aiutato nel leggere con padas il csv perchè non avevo capito subito che c’era un problema nella lettura e codifica del file, questa (link) invece per l’estrazione della prima parola quando ci sono dei caratteri speciali iniziali.

 

Grazie per aver letto l’articolo!

Se ti è piaciuto ricondividilo, se pensi meriti delle correzioni scrivimi pure 🙂

Un abbraccio

Andrea

 

In [1]:
# Import pandas
import pandas as pd

import numpy as np
# Import plotting modules
import matplotlib.pyplot as plt

import re
file_name='C_17_dataset_15_download_itemDownload_0_upFile.csv'
csv=pd.read_csv(file_name,sep=';',encoding="ISO-8859-1",skiprows=1)
csv.info()
#Visualizzo il titolo dei farmaci
#Questo è necessario per il successivo
#processo di pulizia e aggregazione 
print(csv['Denominazione della confezione'])
csv_mod=csv.dropna().copy()
csv_mod['Farmaco']=None
#Un prodotto Rinazina aveva ** ad inizio stringa perchè il ministero doveva confermare il dato
#per comodità ho rimosso ** 
csv_mod['Denominazione della confezione']=csv_mod['Denominazione della confezione'].str.replace('*','')
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 52 entries, 0 to 51
Data columns (total 6 columns):
N°                                                                        51 non-null object
Codice Autorizzazione all'Immissione in Commercio
(AIC)                   50 non-null float64
Denominazione della confezione                                            50 non-null object
Fascia PTN                                                                50 non-null object
Modalità
Prescrizione                                                     50 non-null object
Quantità confezioni fornite alle farmacie ed agli esercizi commerciali    50 non-null object
dtypes: float64(1), object(5)
memory usage: 2.5+ KB
0            TACHIPIRINA "500 MG COMPRESSE"20 COMPRESSE
1      TACHIPIRINA "120 MG/5 ML SCIROPPO"FLACONE 120 ML
2     ENTEROGERMINA "2 MILIARDI/5 ML  SOSPENSIONE OR...
3     RINAZINA "100 MG/100 ML SPRAY NASALE, SOLUZION...
4           TACHIPIRINA "500 MG COMPRESSE" 30 COMPRESSE
5     **RINAZINA ANTIALLERGICA "1 MG/ML SPRAY NASALE...
6                  OKITASK "40 MG GRANULATO" 10 BUSTINE
7     DAFLON "500 MG COMPRESSE RIVESTITE CON FILM" 3...
8     ENTEROGERMINA "4 MILIARDI / 5 ML SOSPENSIONE O...
9     MOMENT "200 MG COMPRESSE RIVESTITE"  12 COMPRESSE
10    GLICEROLO CARLO ERBA "ADULTI 6,75 G SOLUZIONE ...
11    ENTEROGERMINA "2 MILIARDI/5 ML  SOSPENSIONE OR...
12    FLUIBRON "15 MG/2 ML SOLUZIONE DA NEBULIZZARE"...
13            VOLTAREN EMULGEL " 1 % GEL " TUBO DA 60 G
14    PURSENNID "12 MG COMPRESSE RIVESTITE" 30 COMPR...
15    GLICEROLO CARLO ERBA "ADULTI 2250 MG SUPPOSTE ...
16    TACHIPIRINA "BAMBINI 250 MG SUPPOSTE" 10 SUPPOSTE
17             VOLTAREN EMULGEL " 2 % GEL" TUBO DA 60 G
18    ASPIRINA "400 MG COMPRESSE EFFERVESCENTI CON V...
19     MAALOX "PLUS COMPRESSE MASTICABILI" 30 COMPRESSE
20    PROCTOLYN "0,1 MG/G + 10 MG/G CREMA RETTALE" T...
21     GYNO-CANESTEN "2% CREMA VAGINALE" 1 TUBO DA 30 G
22       BIOCHETASI "GRANULATO EFFERVESCENTE"20 BUSTINE
23              IMODIUM "2 MG CAPSULE RIGIDE" 8 CAPSULE
24    VIVIN C "330 MG + 200 MG COMPRESSE EFFERVESCEN...
25                 OKITASK "40 MG GRANULATO" 20 BUSTINE
26    ASPIRINA "400 MG COMPRESSE EFFERVESCENTI CON V...
27    VEROLAX "6,75 G ADULTI SOLUZIONE RETTALE" 6 CO...
28    TACHIPIRINA "500 MG GRANULATO EFFERVESCENTE"20...
29    ASPIRINA DOLORE E INFIAMMAZIONE "500 MG COMPRE...
30                     CANESTEN "1% CREMA" TUBO DA 30 G
31    MAALOX "400 MG + 400 MG COMPRESSE MASTICABILI"...
32    VICKS SINEX "ALOE 0,05% SOLUZIONE DA NEBULIZZA...
33                               ESSAVEN "1% + 0,8% GEL
34              VOLTAREN EMULGEL "1% GEL" TUBO DA 120 G
35       TANTUM VERDE "0,15% COLLUTORIO" FLACONE 240 ML
36    NUROFEN FEBBRE E DOLORE "BAMBINI 100 MG/5 ML S...
37    REACTINE "5 MG + 120 MG COMPRESSE A RILASCIO P...
38    MOMENDOL "220 MG COMPRESSE RIVESTITECON FILM" ...
39    BUSCOPAN "10 MG COMPRESSE RIVESTITE" 30 COMPRE...
40          LASONIL ANTIDOLORE "10% GEL" 1 TUBO DA 50 G
41    LORMETAZEPAM MYLAN GENERICS " 2,5 MG/ ML GOCCE...
42    ARVENUM "500 MG COMPRESSE RIVESTITE CON FILM" ...
43    CLISMA LAX "SOLUZIONE RETTALE" 1 FLACONE DA 13...
44    MOMENT " 200 MG COMPRESSE RIVESTITE " 36 COMPR...
45    BISOLVON "4 MG/5 ML SCIROPPO GUSTO CIOCCOLATO ...
46            VOLTAREN EMULGEL " 2 % GEL" TUBO DA 100 G
47    FROBEN GOLA "0,25% SPRAY PER MUCOSA ORALE" FLA...
48    TACHIPIRINA "ADULTI 1000 MG SUPPOSTE" 10 SUPPOSTE
49    TACHIPIRINA "BAMBINI 500 MG SUPPOSTE" 10 SUPPOSTE
50                                                  NaN
51                                                  NaN
Name: Denominazione della confezione, dtype: object
In [2]:
#Aggiungiamo la colonna Farmaco al nostro DataFrame
csv_mod['Farmaco']=None
def primaparola(colonna_di_testo):
    
    pattern=r'\W*(\w[^,. !?"]*)'
    return re.match(pattern,colonna_di_testo).group()

print(type(csv_mod['Denominazione della confezione']))

estratto=csv_mod['Denominazione della confezione'].apply(primaparola)
csv_mod['Farmaco']=estratto
csv_mod['Quantità confezioni fornite alle farmacie ed agli esercizi commerciali']=pd.to_numeric(csv_mod['Quantità confezioni fornite alle farmacie ed agli esercizi commerciali'].str.replace('.',''))

grouped=csv_mod.groupby(by='Farmaco').sum()

print(csv_mod.info())
<class 'pandas.core.series.Series'>
<class 'pandas.core.frame.DataFrame'>
Int64Index: 50 entries, 0 to 49
Data columns (total 7 columns):
N°                                                                        50 non-null object
Codice Autorizzazione all'Immissione in Commercio
(AIC)                   50 non-null float64
Denominazione della confezione                                            50 non-null object
Fascia PTN                                                                50 non-null object
Modalità
Prescrizione                                                     50 non-null object
Quantità confezioni fornite alle farmacie ed agli esercizi commerciali    50 non-null int64
Farmaco                                                                   50 non-null object
dtypes: float64(1), int64(1), object(5)
memory usage: 3.1+ KB
None
In [3]:
df_farmaco=grouped['Quantità confezioni fornite alle farmacie ed agli esercizi commerciali'].sort_values(ascending=False)
ln=np.arange(0,len(df_farmaco))
label=df_farmaco.index
In [6]:
label=df_farmaco.index
#Rappresentiamo in nostri dati attraverso uno scatter plot
plt.scatter(ln,df_farmaco)
plt.title('Medicinali senza obbligo di prescrizione più venduti primo semestre 2016 alle farmacie aperte al pubblico ed agli esercizi commerciali')

plt.ylabel('# di confezioni vendute')
plt.xticks(ln,(label) ,rotation=90)
plt.text(10, 4, 'Elaborazioni Ing. Andrea Ciufo',
         fontsize=15, color='gray',
         ha='center', va='top', alpha=0.5)
plt.rcParams["figure.figsize"] = (15,4)
plt.show()

 

I farmaci più venduti in Italia

Annunci

Lascia un commento

Archiviato in riflessioni, Salute e Benessere

Probabilità & Statistica

 

Per caso quest’anno sto seguendo un corso in parallelo con mia sorella, purtroppo con l’unica differenza che io non potrò sostenere quell’esame a febbraio, si tratta di “Probabilità e Statistica”.

Dimenticavo di dirvi che frequento la facoltà di Ingegneria Civile e lei ad Economia.

Questo mi ha permesso di analizzare tre libri che trattano la materia, il primo adottato dal mio professore, il secondo adottato alla Luiss(più nel dettaglio lei frequenta il canale A della Luiss, non so se cambino i libri su 4 canali di cui mi ha parlato) ed il terzo che ho comprato io.

Quello consigliato dal mio professore è il libro di Sheldon M. Ross “Probabilità e Statistica per le scienze e l’ingegneria”, io invece ho comprato “Introduzione alla Statistica” sempre di Sheldon M. Ross nell’ottica di sostenere l’esame l’anno successivo e studiarmi così sia il libro introduttivo che quello consigliato dal professore, perchè considero la probabilità e la statistica due discipline fondamentali al di là delle applicazioni ingegneristiche.

Avrò così strumenti per fare indagini statistiche all’interno di Artikolate, per analisi di marketing e mercato, insomma delle applicazioni trasversali.

 

Per cosa si differenziano i due libri di Ross?

Il libro introduttivo è per chi non ha basi di analisi matematica, andrebbe benissimo anche al liceo se si volesse conoscere l’argomento, è molto scorrevole, esercizi con le soluzioni in appendice, citazioni di matematici, filosofi e scrittori ad inizio capitolo.

La cosa interessante è che gli esercizi spaziano dalla medicina al gioco d’azzardo, dalla sociologia all’idrologia. Inoltre ogni capitolo ha una pagina sulla storia o di alcuni argomenti o di alcuni statisti importanti, molto importante per chi non sta studiando esclusivamente al fine di un esame.

Per esempio lo sapevate che lo studio della probabilità l’abbiamo inaugurato noi italiani per la nostra passione al gioco d’azzardo? Ebbene si!

 

Un libro alla portata di tutti ed un valido strumento per ricerche in ogni campo, vale la pena spenderli quei 34 euri.

 

“Probabilità e Statistica per le scienze e l’ingegneria” è più “matematico” compaiono integrali, limiti, mai visti invece nel libro introduttivo, ma tratta i medesimi argomenti, infatti arrivando a quasi metà libro(“Introduzione alla statistica”) mi sono ritrovato al passo con il programma che sta seguendo in questo periodo il professore.

Il libro adottato alla Luiss invece l’ho trovato molto freddo, anche la stessa impaginazione è meno curata, mancano “sfizi” come i riferimenti storici, a differenza degli altri due libri non c’è una introduzione al capitolo chiara, bene o male tratta gli stessi argomenti ed è stato redatto da una docente dell’università del Sannio se non ricordo male, mi è piaciuto davvero poco.

In conclusione se dovete studiare per conto vostro statistica il libro di Ross introduttivo è ideale.

 

Lascia un commento

Archiviato in Uncategorized