Հորիզոնական Boxplots կետերով, օգտագործելով Seaborn Python-ում
Boxplots-ը տվյալների հավաքածուների տվյալների վիզուալիզացիայի համար հասանելի ամենահայտնի գործիքներից է, որը հիմնականում ստեղծվում է Seaborn կոչվող python գրադարանի միջոցով, որն ապահովում է ինչպես հորիզոնական, այնպես էլ ուղղահայաց տուփերի և այլ տեսակի վիզուալիզացիաներ ստեղծելու պարզ և հզոր միջոց:
Այս հոդվածում մենք կկենտրոնանանք այն բանի վրա, թե ինչպես կարելի է ստեղծել հորիզոնական տուփի սխեման՝ օգտագործելով Seaborn Python-ում:
Ինչ է տուփի հողամասը:
Նախ, եկեք սահմանենք, թե ինչ է տուփը: Boxplot-ը տվյալների շտեմարանի գրաֆիկական ներկայացումն է, որը փոխանցում է տվյալների բաշխումը տվյալների շտեմարանում՝ օգտագործելով outliers, quartiles և median: Գծապատկերի մեջտեղում գտնվող վանդակը ներկայացնում է տվյալների միջքառորդական միջակայքը (IQR), որի բեղերը տարածվում են նվազագույն և առավելագույն արժեքների վրա, որոնք ընկնում են միջինից որոշակի հեռավորության վրա: Outliers-ը ներկայացված են որպես առանձին կետեր բեղերից դուրս:
Հորիզոնական տուփեր՝ Seaborn-ի օգտագործմամբ կետերով
Եկեք սկսենք նրանից, թե ինչպես կարող ենք ստեղծել հորիզոնական տուփի սխեման կետերով՝ օգտագործելով Seaborn Python-ում: Մենք կօգտագործենք «խորհուրդներ» կոչվող «Սիբորնի» գրադարանի տվյալների բազան, որը պարունակում է տեղեկատվություն, որը պարունակում է սյունակների ընդհանուր հաշվարկի գումարը և շաբաթվա օրը ռեստորանում:
Ստորև բերված են այն քայլերը, որոնք մենք կհետևենք՝ Python-ում Seaborn-ի միջոցով կետերով հորիզոնական տուփի գծապատկեր ստեղծելու համար.
-
Ներմուծեք բոլոր անհրաժեշտ գրադարանները, ինչպիսիք են seaborn-ը և matplotlib-ը:
բեռնել «tips» հավաքածուն՝ օգտագործելով sns.load_dataset() ֆունկցիան −
Այնուհետև մենք կարող ենք ստեղծել հորիզոնական արկղ՝ օգտագործելով sns.boxplot() ֆունկցիան:
Մենք x և y փոփոխականները դնում ենք համապատասխանաբար «total_bill» և «day»՝ գծապատկերի ընդհանուր գումարը x առանցքի վրա, իսկ շաբաթվա օրը y առանցքի վրա:
Մենք նաև whis պարամետրը դրեցինք [0, 100]՝ տվյալների ամբողջ տիրույթը ցույց տալու համար, և կարգավորեցինք տուփերի լայնությունը և ծայրամասերի չափը՝ օգտագործելով լայնության և թռուցիկների չափի պարամետրերը:
Վերջապես, մենք դրեցինք orient պարամետրը «h»՝ հորիզոնական տուփի գծապատկեր ստեղծելու համար:
Հաջորդը, մենք կարող ենք անհատական տվյալների կետեր ավելացնել սյուժեին՝ օգտագործելով sns.swarmplot() ֆունկցիան:
Մենք կրկին x և y փոփոխականները դնում ենք «total_bill» և «day» և կարգավորում ենք կետերի չափն ու գույնը՝ օգտագործելով չափի և գույնի պարամետրերը:
Մենք նաև դրել ենք orient պարամետրը «h»՝ հորիզոնական երևույթ ստեղծելու համար:
Վերջապես, մենք ավելացնում ենք վերնագիր և առանցքի պիտակներ սյուժեին՝ օգտագործելով ստանդարտ Matplotlib ֆունկցիաները plt.title(), plt.xlabel() և plt.ylabel():
-
Այնուհետև մենք կարող ենք ցույց տալ սյուժեն՝ օգտագործելով plt.show() ֆունկցիան
Օրինակ
import seaborn as snsb
import matplotlib.pyplot as pltt
# Load example dataset
tips_df = snsb.load_dataset("tips")
# Create horizontal boxplot with points
snsb.boxplot(x="total_bill", y="day", data=tips_df, whis=[0, 100], width=.6, fliersize=5, orient="h")
snsb.swarmplot(x="total_bill", y="day", data=tips_df, color=".2", size=3, orient="h")
# Add title and axis labels
pltt.title("Total Bill by Day")
pltt.xlabel("Total Bill ($)")
pltt.ylabel("Day of Week")
# Show plot
pltt.show()
Արդյունք
Ծրագիր հարմարեցված հորիզոնական տուփի համար
import seaborn as snss
import matplotlib.pyplot as pltt
# Load example dataset
tips_df = snss.load_dataset("tips")
# Set style and color palette
snss.set_style("whitegrid")
snss.set_palette("husl")
# Create horizontal boxplot with points
snss.boxplot(x="total_bill", y="day", data=tips_df, whis=[0, 100], width=.6, fliersize=5, orient="h")
snss.swarmplot(x="total_bill", y="day", data=tips_df, color="black", size=4, orient="h")
# Customize plot appearance
pltt.title("Total Bill by Day", fontsize=14, fontweight="bold")
pltt.xlabel("Total Bill ($)", fontsize=12)
pltt.ylabel("Day of Week", fontsize=12)
pltt.xticks(fontsize=10)
pltt.yticks(fontsize=10)
# Adjust plot dimensions
pltt.figure(figsize=(8, 6))
# Show plot
pltt.show()
Արդյունք
Վերոնշյալ հարմարեցված ծրագրում մենք սկսում ենք ներմուծել անհրաժեշտ գրադարանները, ներառյալ Seaborn-ը և Matplotlib-ը:
Բեռնեք «tips» կոչվող տվյալների հավաքածուն՝ օգտագործելով sns.load_dataset() գործառույթը Seaborn-ից:
Անհատականացրեք սյուժեի տեսքը՝ ոճը դնելով «whitegrid»՝ օգտագործելով sns.set_style(): Բացի այդ, մենք գունային գունապնակը դրեցինք «husl»՝ օգտագործելով sns.set_palette():
Ստեղծեք հորիզոնական տուփի սխեման՝ օգտագործելով sns.boxplot()՝ նշելով x և y փոփոխականները համապատասխանաբար որպես «total_bill» և «day»:
Մենք հարմարեցնում ենք տարբեր պարամետրեր, ինչպիսիք են՝ whis-ը, լայնությունը և թռուցիկի չափը՝ տուփի տեսքը հարմարեցնելու համար:
Անհատական տվյալների կետեր ավելացնելու համար մենք օգտագործում ենք sns.swarmplot() և հարմարեցնում ենք դրա գույնը, չափը և կողմնորոշումը:
Սյուժեի տեսքը հետագայում հարմարեցնելու համար մենք փոփոխում ենք վերնագիրը, xlabel-ը և ylabel-ը՝ օգտագործելով Matplotlib-ից plt.title(), plt.xlabel() և plt.ylabel() ֆունկցիաները:
-
Մենք նաև կարգավորում ենք վերնագրի, պիտակների և տառերի տառաչափերը՝ օգտագործելով տառաչափը:
Բացի այդ, մենք կարող ենք կարգավորել գծապատկերի չափերը՝ նշելով նկարի չափը՝ օգտագործելով plt.figure() և ցանկալի չափերը փոխանցելով որպես բազմակի:
Վերջապես, մենք օգտագործում ենք plt.show()՝ ցուցադրելու հարմարեցված հորիզոնական արկղը կետերով:
Եզրակացություն
Եզրափակելով, Python-ում Seaborn-ի օգտագործմամբ հորիզոնական արկղերի ստեղծումը կարևոր տեխնիկա է տվյալների հավաքածուների վիզուալացման, տվյալների բաշխման և տարբեր փոփոխականների միջև փոխհարաբերությունները ուսումնասիրելու համար: Մենք օգտագործել ենք ծովածոցների boxplot() և swarmplot() ֆունկցիաները՝ ստեղծելու տեսողական գրավիչ հորիզոնական տուփեր, որոնք պատկերում են հիմնական վիճակագրական չափորոշիչները, ինչպիսիք են մեդիանները, ծայրամասերը և քառորդները: